Jump to content
Forumu Destekleyenlere Katılın ×
Paticik Forumları
2000 lerden beri faal olan, çok şukela bir paylaşım platformuyuz. Hoşgeldiniz.

Veri Düzenliyoruz


deadwoll

Öne çıkan mesajlar

Soruyu nasıl sormam gerektiğini bir türlü bilemediğimden google'dan yardım alamıyorum. En azından soruyu nasıl sormam gerektiğini söylerseniz oradan da yürüyebilirim.

Country 1              Country 2              T. Flow                    Year

A                                 A                            1                          1

A                                 A                            2                          2

A                                 B                            3                          1

A                                 B                            2                          2

A                                 C                            1                          1

A                                 C                            3                          2

B                                 A                            4                          .

B                                 A                            2                          .

B                                 B                            3                          .

B                                 B                            2

B                                 C                            4

B                                 C                            5

C                                 A                            1

C                                 A                            2

C                                 B                            3

C                                 B                            2

C                                 C                            3

C                                 C                            4

 

Şimdi yukarıdaki country 1 ve country 2'nin ülkeler, T.Flow'un da iki ülke arasındaki C1'den C2'ye doğru ticaret akışı olduğunu düşünelim. Benim elimde bir de her bir ülkeye ait

 

Country                   GDP                       Year

A                                3                            1

A                                4                             2

B                                1                             1

B                                3                             2

C                                2                             1

C                                1                             2

 

Şeklinde GSMH verileri var, ben bu GSMH verilerini ilk verisetine tekrarlı bir halde aktarmak istiyorum. Bunu da iki farklı şekilde yapmam gerekiyor.

1 - A ülkesinin 1. yıldaki GSMH'ı Country 1'de A ülkesinin yer aldığı tüm durumlarda yer alacak.

2 -  Aynı şeyi Country 2 için de yapılacak.

Çok kabaca

Country 1              Country 2              T. Flow                    Year               GDP.C1               GDP.C2

A                                 A                            1                          1                      3                           3

A                                 A                            2                          2                      4                           4

A                                 B                            3                          1                     3                           1

A                                 B                            2                          2                      4                           3

A                                 C                            1                          1                      3                          2

A                                 C                            3                          2                     4                            1

B                                 A                            4                          .                      1                           3

B                                 A                            2                          .                       3                           4

B                                 B                            3                          .                       1                           .

B                                 B                            2                                                  3                           . 

B                                 C                            4                                                 .                            .

B                                 C                            5                                                 .

C                                 A                            1                                                 .

C                                 A                            2

C                                 B                            3

C                                 B                            2

 

gibi olmasını istiyorum. 70k civarı gözlem ve 59*58 tane ülke kombinasyonu olduğundan elle yapmam mümkün değil. Verileri de database'den doğrudan çekemiyoruz, sistem hazırlayıp excel dosyası olarak DL linki açıyor, ayrıca iki ayrı kaynak kullanıyorum falan işin içinden çıkamadım. Bunu excel'de falan halledebilmemin bir yolu var mıdır? Ya da google'a ne sormam gerekiyor? Keyword'ü nedir bu işin?

Link to comment
Sosyal ağlarda paylaş

np, kolay gelsin. vlookup'da dikkat etmen gereken sey su:

butun kolon'da lookup yaptigi icin formul baya kaynak harcar, sonsuza uzatma vlookup'i eski bilg.'sa.

 

bir de formulu mouse'la asagi kopyalamadan $ ile kitliyorsun (misal sabit bir yerden lookup yaptircan), vertikal veya horizontal.

vlookup bozulmasin asagi cekince. ?

(bu genel tabi hucre sabitleme)

 

 

Goering tarafından düzenlendi
Link to comment
Sosyal ağlarda paylaş

Çok teşekkür ettim, $ koymayı unutuyormuşum ben. Doğrusu ilk başta excel'de yapabileceğimi de düşünmemiştim, genelde veri excel formatında geliyor R'a falan çekip düzenliyorum, kafam oraya gitti.

Index-match'e de bakacağım, bir de udemy'de tidyverse ve diğer data handling kütüphaneleri için ders buldum onu da satın alacağım. Doktoradan sonra özgür kalınca daha geniş verisetleriyle çalışabileceğim alanlara kaydım, bayağı bir toolkit lazım.

Link to comment
Sosyal ağlarda paylaş

$ koymayi unutacagini tahmin ettim, o yuzden yazdim onceden heheh

 

excel'de cogu sey yapabiliyorsun, yapamadiklarin icin R veya python.

python'da pandas ogrenmeye calis, gelecek orda ? 

(sql'e hic gerek kalmiyor -data almak disinda- eger data analiz yapiyorsan)

tableau'yu da grafik/chart vs icin oneririm.

Goering tarafından düzenlendi
Link to comment
Sosyal ağlarda paylaş

Bu dönem ders vermiyorum zaten, R'da eksik kaldığım kısımları tamamlayıp Python bootcamp'e başlayacağım. Formal programlama eğitimine ihtiyacım var biraz, bazı ileri düzey şeyleri biliyorum ama bazı çok temel mevzulardan haberim yok. Bazen bazı fonksiyonları varlıklarından haberdar olmadan kendim yazıp kullanıyorum işlerimde.

Link to comment
Sosyal ağlarda paylaş

Yeni konu açmıyım şimdi, elimdeki verisetinin %20 civarı NA, normalde NA'leri ignore ediyordum ama bu sefer silinmiş verisetiyle bir kaç farklı yöntemi kıyaslıyım dedim. Bir de kendi kodlarımı hala NA gözlemleri ignore edecek şekilde düzenleyemedim kullandığım matrix package'ları yüzünden.

R'daki MICE package'i bir kaç olasılık sunuyor bu amaçla ama benim verisetim panel, NA'ler de genellikle tamamen rassal NA değil, ya eski dönemler eksik oluyor ya da ülkelerde içsavaş vs. instability olduğunda raporlamada sorun çıkıyor. Dolayısıyla random forest uygulanabilir mi emin değilim. Yine zaman serileri için geliştirilmiş bir kaç algoritma var ama panel veride onları kullanabilir miyim emin değilim. Oturdum dökümantasyon okuyorum ama bayağı yüzeysel geçiyor onlar da sanki.

Özellikle veri tiplerine göre detaylanan bu konuda okuyabileceğim kaynaklar var mı bildiğiniz?

Link to comment
Sosyal ağlarda paylaş

Ben şu topic'i açtıktan sonra tidyverse'e gömüldüm, günde 3-4 saat falan çalışıyorum defter kitap açıp sdf, tidyverse serisini bitirdim, tüm assignment'ları 3-5 alternatifle çözdüm. Çağ atladım bir haftada.

Bir tane de masterclass aldım udemy'den bakalım o nasıl olacak? Bu zamana kadar hep base'den yürüyordum data handling konusunda, çoğu zaman oturup saçma sapan looplar yazmam gerekiyordu ve öyle olunca bayağı zaman kaybediyordum.

 

 

Link to comment
Sosyal ağlarda paylaş

×
×
  • Yeni Oluştur...