Menggabungkan dataset Stata : Append

Append adalah salah satu cara di Stata yang digunakan untuk menggabungkan dataset ketika ada data yang memiliki kesamaan. Append akan menggabungkan data secara vertikal. 

Append bisa dilakukan dengan dua cara. Yang pertama melalui toolbar Data > Combine datasets > Append datasets. Dan yang kedua melalui command.

Command append bisa digunakan dengan aturan sebagai berikut:

1. Ketika tidak ada data yang sedang di gunakan di Stata

append using data1 data2

2. Ketika ada data yang di gunakan, misal sedang menggunakan data data1.dta dan mau menggabungkan dengan data yang ada pada file data2.dta

append using data2

3.  Ketika ada data yang digunakan dan ingin membuat variabel baru untuk menunjukkan sumber dataset.

append using data2, generate(newv)

4. Ketika ada data yang digunakan tetapi tidak mau mengambi label dari data yang ingin digabung.

Append using data2, generate(newv) nolabel nonotes

5. Hanya menggunakan variabel tetertentu pada data yang ingin digabung

append using data2, keep(v1 v2 v3)

Contoh saya mempunyai dua file data. File data pertama berisi data kode wilayah dan kotanya diberi nama poscode1.dta . File data kedua berisi data kode wilayah,  kode pos, kelurahan dan kecamatan diberi nama poscode2.dta 




Lalu saya gabungkan dengan command 

append using poscode1.dta poscode2.dta

maka pada Stata data pada file poscode2 akan ditambahkan dibawah data file poscode1 yang bisa di lihat pada data editor. Pada bagian hasil Stata (result pane) akan muncul notifikasi karena ada perbedaan panjang huruf yang digunakan.


Berbeda jika kita menggunakan command append using poscode2.dta poscode1.dta maka data yang di dapat adalah data pada file poscode1 akan ditambahkan dibawah data file poscode2.

Untuk lebih jelasnya saya akan menambahkan variabel baru yang menunjukkan asal data. Dan memanggil file poscode2 terlebih dahulu.

append using poscode2.dta poscode1.dta, generate(from)

maka bisa kita lihat di data editor terdapat satu kolom baru yaitu From. Angka 1 menunjukkan data berasal dari file pertama yaitu poscode2.dta dan angka 2 menunjukkan data berasal dari file kedua yaitu poscode1.dta


Perlu diingat pada append jika ada data yang sama di antara dua file maka data tersebut akan ditambahkan begitu saja. Dari kedua data yang saya punya ada satu variabel yang sama yaitu KodeWilayah, Ketika hasil data append tersebut akan di sort berdasarkan KodeWilayah maka terlihat ada dua baris data yang memiliki kode wilayah yang sama dan berasal dari file pertama dan file kedua.


Sumber dappend dan data kode pos