Bu ayki bültenimize kısa bir anketle başlayarak Türkiye’de açık veri kullanımına dair küçük ama değerli ipuçları toplamayı hedefliyoruz.
Görüşleriniz, bültenimizin gelişimi için büyük önem taşıyor. Gelecek sayılarda daha iyi içerikler sunabilmemiz için yorumlarınızı bizimle paylaşmayı unutmayın.
Haberler
“The State of Open Humanitarian Data 2025” Raporu Yayımlandı!
Birleşmiş Milletler İnsani İşler Koordinasyon Ofisi (OCHA) tarafından hazırlanan ve insani krizlerde veri erişiminin mevcut durumunu değerlendiren “The State of Open Humanitarian Data 2025” raporu yayımlandı. Rapor, analizlerini OCHA’nın yönettiği açık veri platformu Humanitarian Data Exchange(HDX) üzerinden sağlanan veriler doğrultusunda sunuyor. İncelemeler bölümünde de ele aldığımız HDX, insani kriz verilerinin paylaşımını ve erişimini kolaylaştırmayı amaçlayan küresel ölçekte etkili bir veri altyapısı sağlamaktadır.
Rapor, 2024 yılı boyunca HDX platformunun 1,4 milyon kullanıcıya ulaştığını ve 3,5 milyon veri seti indirildiğini gösteriyor. Ayrıca, insani yardım alanında API tabanlı veri paylaşımının yükselişine dikkat çekiyor. 2024 yılı sonunda HDX’te yer alan yaklaşık 20.000 veri setinin %80’i otomatik süreçlerle güncellenmiş durumda. Bu veriler, platformda yer alan 216 kuruluştan yalnızca %25’ini oluşturan 51’i tarafından sağlanıyor. Öte yandan, HDX Data Grid sistemine katkı sunan 16 kuruluşun 11’i verilerini API aracılığıyla entegre ederek veri akışını hızlandırıyor ve standardizasyonu güçlendiriyor.
Raporda yer alan küresel değerlendirmeye göre, HDX’te analiz edilen 22 kriz bölgesindeki verilerin %74’ü erişilebilir ve güncel, %17’si erişilebilir ancak güncel değil ve %9’u erişilemez durumda. Bu bölgelerde toplamda 6 ana kategori ve 20 alt kategori altında veri toplanmakta; 16 farklı kuruluş ise bu veri paylaşımına katkı sunmaktadır. Bu istatistikler, insani yardım operasyonlarında açık veri erişiminin kritik rolünü ve hala gelişmeye açık alanları gözler önüne seriyor.
Bu rapor, insani krizlerin daha iyi anlaşılması ve müdahalelerin daha etkili planlanabilmesi için açık veriye olan ihtiyacın devam ettiğini ortaya koyuyor. Detaylı analizlere ulaşmak için raporu incelemeyi unutmayın!
Daha fazla bilgi için: The State of Open Humanitarian Data 2025 Raporu
Türkçe Veri Setlerinin Kalitesi Üzerine Kapsamlı Bir Değerlendirme!
Ortadoğu Teknik Üniversitesi (ODTÜ) NLP yürütücülüğünde, ODTÜ, Hacettepe Üniversitesi, İstanbul Üniversitesi ve Turkcell Technology iş birliğiyle yürütülen çalışmada, Türkçe yapay zeka model eğitimi ve testlerinde kullanılan 17 veri seti incelendi.
Üniversite ve sektör temsilcilerinden oluşan yaklaşık 30 etiketleyicinin katıldığı çalışmada 17 yaygın kullanılan Türkçe veri kaynağı, cevap doğruluğu, dilbilgisi ve kültürel uyumluluk gibi 6 farklı kriterde değerlendirildi. Ayrıca insanlar yerine popüler LLM modelleri de değerlendirici (LLM-as-a-Judge) olarak analiz edildi.
Çalışmanın çıktılarının şu şekilde olduğunu görüyoruz:
Güçlü ve Zayıf Yönler:
Bu veri kaynaklarının %70’i kalite standartlarını karşılamadı ve kriterlerin %85’i yerine getirilemedi. Bu veri kaynakları teknik terimlerin doğruluğu konusunda güçlü olsa da, kültürel uygunluk ve dilbilimsel netlik gibi alanlarda yetersiz kaldı.
İnsan ve LLM-as-a-Judge Etiketleri:
Kültürel nüansları ve genel bilgiyi anlamada insanlar LLM’lerden daha başarılı. LLM-as-a-Judge olarak GPT-4o, dilbilgisi ve teknik görevlerde daha iyi performans gösterirken kültürel uyumlulukta insanlardan uzaklaştı. Llama3.3-70B ise doğruluk ve kültürel bilgi değerlendirmelerinde daha etkili.
Harekete Geçme Çağrısı:
Bu eksiklikleri gidermek ve Türkçe gibi düşük kaynaklı dillerde ilerleme sağlamak için dilbilimsel olarak titiz ve kültürel olarak hassas veri kaynaklarına ihtiyaç var.
Daha fazla bilgi için: Evaluating the Quality of Benchmark Datasets for Low-Resource Languages: A Case Study on Turkish ve Çağrı Toraman LinkedIn Paylaşımı
Açık Veri Editörü’nün 1.4.0 Sürümü Çıktı!
Open Knowledge Foundation (OKFN), uzun süredir üzerinde çalıştığı Açık Veri Editörü aracının son sürümünü veri meraklılarıyla buluşturdu. Bu yenilikçi araç, açık veri projelerinde veri temizleme, doğrulama ve yeniden kullanım süreçlerini kolaylaştırmayı amaçlıyor. Özellikle kamuya açık verilerin işlenmesi ve analiz edilmesinde araştırmacılara, gazetecilere ve proje geliştiricilerine büyük kolaylık sağlayacak olan editör, açık veri erişilebilirliğini artırmayı hedefliyor.
Bilgisayarınızda Açık Veri Editörü’nün önceki sürümleri yüklüyse, güncellemenin otomatik olarak yapılmayacağını lütfen unutmayın. Aşağıdaki bağlantıları kullanarak tekrar indirmeniz gerekmektedir:
Debian/Ubuntu: https://lnkd.in/dmPzaMzy
macOS: https://lnkd.in/dGzRP2Qz
Windows: https://lnkd.in/dkgvAzhz
Daha fazla bilgi için: OKFN LinkedIn Paylaşımı
Kaggle ve Wikimedia, Açık Veri Alanında İş Birliği Yapıyor!
Wikimedia Enterprise, Kaggle üzerinde İngilizce ve Fransızca dillerindeki yapılandırılmış Wikipedia içeriklerini içeren yeni bir beta veri seti yayımladı. Makine öğrenimi (ML) ve doğal dil işleme (NLP) uygulamaları için özel olarak tasarlanan bu veri seti, araştırmacılar ve geliştiriciler için temizlenmiş ve önceden işlenmiş makale verilerine kolay erişim sağlamaktadır.
Bu veri seti, tutarlı bir şema ile yapılandırılmış JSON dosyaları olarak önceden ayrıştırılmış ve çıktısı alınmış Wikipedia'nın İngilizce ve Fransızca dil sürümlerindeki tüm makaleleri içermektedir. Her JSON satırı, fazladan işaretleme veya düzyazı olmayan bölümlerden (referanslar vb.) arındırılmış, tam bir Wikipedia makalesinin içeriğini barındırır. Bu yapı, kullanıcıların Wikipedia’daki ham makale metinlerini analiz etmek veya ayrıştırmak yerine, içeriğin iyi yapılandırılmış, indirilebilir ve yeniden kullanılabilir JSON formatında verisiyle doğrudan çalışmasına olanak tanır.
Creative Commons Attribution-Share-Alike 4.0 ve GNU Free Documentation License (GFDL) lisanslarıyla yayımlanan bu veri seti, 16 Nisan'da kullanıma sunulmuş olup, kısa sürede 15.000'den fazla görüntülenmiş ve yaklaşık 1000 kez indirilmiştir.
Bu veri seti erken bir beta sürümü olduğundan, veri setinin iyileştirilmesi ve geliştirilmesi için geri bildirimlere büyük önem verilmektedir. Veriyi inceledikten sonra düşüncelerinizi, önerilerinizi ve karşılaştığınız sorunları Meta Wiki'deki Wikimedia Enterprise ana sayfasının tartışma bölümünde ya da Kaggle üzerinde veri setine ait tartışma sayfasında paylaşmayı ihmal etmeyin!
Daha fazla bilgi için: Wikimedia Enterprise Blog Yazısı
WorldMove ile 179 Ülkede Sentetik Hareketlilik Verileri Artık Erişilebilir!
Yuan Yuan, Yuheng Zhang, Jingtao Ding ve Yong Li tarafından geliştirilen WorldMove, dünya genelinde 179 ülkede yer alan 1.600'den fazla şehir için sentetik insan hareketliliği verileri sunan büyük ölçekli bir açık veri setidir. Bu çalışma, şehir planlaması, ulaşım yönetimi ve halk sağlığı gibi alanlarda yüksek kaliteli hareketlilik verilerine duyulan ihtiyacı, gizlilik endişeleri ve veri eksikliği gibi engelleri aşarak karşılamayı amaçlamaktadır.
WorldMove, nüfus yoğunluğu haritaları, POI verileri ve işe gidiş-geliş akışları gibi kamuya açık çok kaynaklı verileri kullanarak, şehir ölçeğinde gerçekçi hareketlilik senaryoları oluşturur. Bu veriler, bir model aracılığıyla bireylerin günlük hareketlerini simüle eder. Oluşturulan veri seti, hem bireysel hareketlilik davranışları hem de şehir düzeyindeki nüfus akışları açısından gerçek dünya gözlemleriyle yüksek uyum göstermektedir.
WorldMove çalışmasına ilişkin bilimsel yayına, PDF formatında erişim sağlanabildiği gibi, gönderim biçimine bağlı olarak sıkıştırılmış TeX, DVI, PostScript veya HTML (.gz, .dvi.gz, .ps.gz veya .html.gz) dosya türlerinde de ulaşmak mümkündür. Bu çeşitlilik, araştırmacıların ve geliştiricilerin çalışmayı kendi tercih ettikleri formatta incelemelerini ve yeniden kullanmalarını kolaylaştırmaktadır.
Daha fazla bilgi için: WorldMove, a Global Open Data for Human Mobility
Etkinlikler
Sunshine Fest 2025 Washington’da Gerçekleşti!
Tarih: 19-20 Mart 2025
Yer: Washington, D.C. / ABD
Sunshine Week, gazetecilik, sivil toplum, akademi, kamu ve özel sektör temsilcilerini bir araya getiren tarafsız bir iş birliği platformudur. Temel amacı, kamu kayıtlarına erişimin ve açık hükümet uygulamalarının demokrasilerdeki önemine dikkat çekmektir.
Bu ulusal farkındalık haftası, Florida Üniversitesi Gazetecilik ve İletişim Fakültesi bünyesindeki Florida Üniversitesi Gazetecilik ve İletişim Fakültesi bünyesindeki Joseph L. Brechner Bilgi Edinme Özgürlüğü Projesi tarafından koordine edilmekte; John S. ve James L. Knight Vakfı’nın desteğiyle ve her yıl genişleyen bir ortak ağıyla yürütülmektedir.
Etkinlik, her yıl Mart ayının ortalarında kutlanmaktadır. Bu tarih, ABD'nin dördüncü başkanı ve anayasasının mimarlarından James Madison'ın doğum günüdür (1751). Madison, ifade özgürlüğü ve basın özgürlüğü gibi temel hakların savunucusu olarak, halkın bilgiye erişim hakkının önemini vurgulamıştır.
Sunshine Week haftasının 20. yıl dönümünde, 19-20 Mart tarihleri arasında Washington, D.C.'de gerçekleştirilen Sunshine Fest, açık hükümet ve bilgiye erişim konularında çalışan gazeteciler, sivil toplum temsilcileri, akademisyenler ve kamu görevlilerini bir araya getirdi. Etkinlikte, yapay zekâ teknolojilerinin bilgi edinme süreçlerine etkisi, kamusal veriye erişimde karşılaşılan zorluklar ve şeffaflık politikalarının geleceği gibi konular ele alındı.
Daha fazla bilgi için: Sunshine Fest 2025
NYC Open Data Week 2025 Gerçekleşti!
Tarih: 22-30 Mart 2025
Yer: New York City (NYC) / ABD
Open Data Week, NYC Office of Technology & Innovation (OTI) , BetaNYC ve Data Through Design (DxD)'deki Açık Veri Ekibi tarafından organize edilen yıllık bir festivaldir. “Açık veri tüm New Yorklular içindir” anlayışıyla şekillenen etkinlik, her yıl Mart ayında gerçekleştirilir. Katılımcılar, New York’un kamu verilerini kutlamak ve 7 Mart 2012’de yürürlüğe giren şehirdeki ilk açık veri yasasının yıldönümünü anmak üzere çevrim içi ve beş ilçede fiziksel olarak bir araya gelirler. Açık Veri Haftası boyunca NYC’nin sivil teknoloji ve açık veri toplulukları buluşarak deneyimlerini paylaşır, kamu verileri üzerine yeni keşiflerde bulunur ve bu verilerin sunduğu fırsatlara dair farkındalığı artırır.
Bu yıl 22-30 Mart tarihleri arasında kutlanan festivalde1, hafta boyunca, katılımcılar, açık verinin şehir yaşamındaki rolünü keşfetmek üzere düzinelerce sanal ve yüz yüze etkinlikte NYC Open Data ile etkileşimde bulunma fırsatı buldular.
Data Through Design’in sergisiyle başlayan etkinlik, BetaNYC'nin düzenlediği yıllık sivil teknoloji konferansı NYC School of Data ile sona erdi.
Daha fazla bilgi için: NYC Open Data Week 2025
2025 OGP Küresel Zirvesi Bu Yıl İspanya’da Gerçekleşecek!
Tarih: 7-9 Ekim 2025
Yer: Vitoria-Gasteiz, İspanya
İspanya Hükümeti, 7-9 Ekim 2025 tarihleri arasında İspanya'nın Vitoria-Gasteiz kentinde 2025 Açık Hükümet Ortaklığı (OGP, Open Government Partnership) Küresel Zirvesi'ne ev sahipliği yapacak. Zirve, dünyanın dört bir yanından 2.000'den fazla üst düzey hükümet temsilcisini, sivil toplum liderlerini ve politika yapıcılarını bir araya getirerek açık hükümet girişimleri ve temel konulardaki uygulamalar konusunda deneyimleri, en iyi uygulamaları ve ilerlemeyi paylaşacak.
2013 yılından beri Kanada, Gürcistan, Estonya, Fransa, Kore, Meksika, Birleşik Krallık ve Brezilya'da düzenlenen zirvenin dokuzuncusu bu yıl İspanya'da gerçekleştirilecek. Açık hükümet alanındaki uluslararası iş birliklerinin gelişmesine katkı sunması beklenen zirve, farklı ülkelerden paydaşları bir araya getirecek.
Neden Katılmalısınız?
Açık hükümet girişimlerini yönlendiren küresel liderlerle bağlantı kurun.
Şeffaflık, hesap verebilirlik ve toplumsal katılım konularında en son reformları ve en iyi uygulamaları keşfedin.
Açık Hükümet Ödülleri aracılığıyla yenilikçi açık hükümet başarılarını kutlayın.
Küresel ölçekte açık yönetişimin geleceğini şekillendirmenin bir parçası olun.
Daha fazla bilgi için: 2025 OGP Global Summit
FDATA Küresel Açık Finans Zirvesi Kayıtları Devam Ediyor!
Tarih: 5 Mayıs 2025
Yer: Washington, ABD
Küresel Açık Finans Zirvesi 2025, 5 Mayıs’ta Washington, D.C.’'de düzenlenecek. Financial Data and Technology Association (FDATA) tarafından organize edilen bu zirve, politika yapıcılar, finansal kurumlar ve fintech liderlerini bir araya getirerek küresel açık finans hareketini ilerletmeyi amaçlıyor.
Zirvede, ödeme modernizasyonu, tüketici veri hakları ve finansal kapsayıcılık gibi konular ele alınacak. Katılımcılar, farklı ülkelerden gelen uzmanların deneyimlerini dinleyerek, açık finansın geleceğine dair stratejiler geliştirme fırsatı bulacaklar.
Etkinlikte konuşmacılar arasında, Akoya'dan Paul LaRusso, Finance Canada'dan Kïrsten Fraser, CFPB'den Dan Murphy, Banco Central do Brasil'den Matheus Rauber, Open Banking Expo'dan Adam Cox ve EPIC'ten Alan Butler gibi isimler yer alacak.
FDATA, açık bankacılık ve açık finans alanında faaliyet gösteren fintech şirketlerini temsil eden, kâr amacı gütmeyen bir derneğidir. Dernek, hükümetler, politika yapıcılar ve düzenleyici otoritelerle iş birliği yaparak, adil ve etik bir rekabet ortamı oluşturmayı hedeflemektedir. FDTA’nın üyeleri, tüketicilerin daha iyi finansal kararlar almasını ve finansal yaşamları üzerinde tam kontrol sahibi olmasını sağlayan yenilikçi finansal uygulamalar ve hizmetler sunar.
Zirveye katılım ücretsiz olup, kayıt ve detaylı bilgi için FDATA'nın resmi web sitesini ziyaret edebilirsiniz.
Daha fazla bilgi için: FDATA Global Open Finance Summit 2025
İncelemeler
Kriz Anlarında Veriye Erişim: HDX Platformu İncelemesi
Humanitarian Data Exchange (HDX), United Nations Office for the Coordination of Humanitarian Affairs(OCHA) tarafından yönetilen, insani kriz verilerinin paylaşımını ve erişimini kolaylaştırmayı amaçlayan bir açık veri platformudur. Temmuz 2014’te veri paylaşımına başlayan HDX, bugün 250'den fazla ülkeden ve 2.000'den fazla kaynaktan gelen yaklaşık 20.000 veri kümesine ev sahipliği yapmaktadır.
HDX’in temel amacı, insani yardım çalışanlarının kriz verilerine kolayca erişmesini ve bu verileri analiz edebilmesini sağlamaktır. Kullanıcı dostu arayüzü ve kapsamlı veri setleriyle, kriz müdahalesi ve karar alma süreçlerini destekleyen platform, aynı zamanda teknik altyapısıyla da açık veri yaklaşımını benimsemektedir. HDX, açık kaynak kodlu CKAN yazılımı üzerine kuruludur ve geliştirme süreçleri OCHA-DAP GitHub hesabı üzerinden şeffaf bir şekilde paylaşılmaktadır.
Kullanıcılar, HDX’in “Data Grid” isimli görselleştirme ekranı sayesinde altı ana kategori ve çeşitli alt başlıklarda en kritik kriz verilerinin mevcudiyetini ve güncelliğini ülkeler ölçeğinde görüntüleyebilmektedir. Bu ekranda veri setleri; içerik uygunluğu, bölgesel kapsamı, formatı ve paylaşım durumu gibi kriterlere göre “mevcut”, “güncel” ya da “mevcut değil” şeklinde sınıflandırılmaktadır.
HDX platformu, yalnızca görsel arayüzler üzerinden değil, aynı zamanda geliştiriciler ve araştırmacılar için sunulan Humanitarian API (HAPI) aracılığıyla da erişilebilir. HAPI, HDX üzerindeki veri setlerine otomatik erişim imkanı sunar. Bu sayede kullanıcılar, sürekli güncellenen insani yardım verilerini kendi uygulamalarına entegre edebilir.
Platformu detaylı incelediğimizde Türkiye’ye ait 173 verinin de yer aldığını görüyoruz. Bu veriler OCHA Türkiye, Qatar Computing Research Institute, International Federation of Red Cross and Red Crescent Societies (IFRC), Humanitarian OpenStreetMap Team ve OurAirports gibi çeşitli kaynaklar tarafından sağlanmaktadır.
Açık Gündem’in 4. sayısında2 da yer verdiğimiz üzere, Norveç Mülteci Konseyi (NRC), CKAN tabanlı veri kataloğu ile kurum içi veri erişimini güçlendirmiş ve insani müdahalelerin veriyle desteklenmesini hedeflemişti. Bu yaklaşım, insani yardım alanında verinin ne denli stratejik bir araç olduğunu bir kez daha ortaya koyarken benzer şekilde, HDX platformu da, küresel ölçekte açık ve erişilebilir veri paylaşımını mümkün kılarak kriz bölgelerinde çalışan aktörler için hayati bir kaynak sağlamayı amaçlamaktadır. NRC’nin kurum içi çözümü ile HDX’in küresel veri havuzu yan yana düşünüldüğünde, insani yardım alanında verinin sadece bir kaynak değil, aynı zamanda bir yön belirleyici olduğu açıkça görülmektedir.
Daha fazla bilgi için: Humanitarian Data Exchange
Bizden Haberler
AVTED Açık Kürsü’de Bu Ay!
Açık Veri ve Teknoloji Derneği’nin “mümkün olduğu kadar açık, gerektiği kadar kapalı” mottosuyla hayata geçirdiği “Açık Kürsü” program serisi hız kesmeden devam ediyor. Program, toplumun çeşitli kesimlerinden uzmanları bir araya getirerek açık bilim, açık erişim, açık devlet, açık veri ve açık teknoloji gibi kavramların detaylı bir şekilde ele alındığı çevrim içi bir platform sunuyor.
Av. Arb. Okşan Gülşen Kömürcü Atalay’ın moderatörlüğünde düzenlenen bu etkinlikler, hem akademik hem de pratik perspektiflerden derinlemesine analizlere yer veriyor. Her bir oturumda, ilgili alanlardaki uzmanların katkılarıyla, bu kavramların uygulanabilirliği, karşılaşılan zorluklar ve toplumsal etkiler detaylı bir şekilde değerlendiriliyor.
14 Nisan’da YouTube’da yayımlanan programda AVTED Yönetim Kurulu Üyesi Gürkan Atabay ile “Açık Veri Portalı Nasıl Kurulur?” konuşuldu.
Programın öne çıkan başlıkları şu şekildeydi;
Başlangıç Noktası: Bir portal kurarken ilk adımlar ne olmalı? Veri setlerini belirlerken nelere öncelik verilmeli?
Teknoloji ve Formatlar: Hangi veri formatları (CSV, JSON, XML vb.) tercih edilmeli? Portal için hangi teknolojik altyapılar kullanılmalı ve neden?
Veri Yönetişimi: Veri bütünlüğü nasıl sağlanır? Etkin bir veri yönetişimi için neler yapılmalı?
Metadata ve Veri Sözlüğü: Metadata (üst veri) ve veri sözlüğü nedir? Açık veri portallarında neden hayati öneme sahiptirler?
Sistem Tasarımı: Verilerin güvenli bir şekilde depolanması, düzenli olarak güncellenmesi ve kullanıcılar için erişilebilirliği nasıl garanti altına alınır?
Tecrübe Paylaşımı: Bu alana yeni gireceklere tavsiyeler neler? Açık veri portalı kurmak isteyenler hangi ilk adımları atmalı ve kurulum sonrası en sık karşılaşılan zorluklar nelerdir?
Açık Kürsü’nün yeni bölümlerini kaçırmamak için AVTED’in YouTube kanalına abone olmayı ve sosyal medya hesaplarını takip etmeyi ihmal etmeyin!
Daha fazla bilgi için: AVTED Açık Kürsü
Bu ay açık veri dünyasından sizlere aktaracaklarımız bu kadardı. Gelecek ay yine burada, yeni hikayelerde görüşmek üzere…
Bursa Büyükşehir Belediyesi Açık Yeşil Veri Platformu