Açık Bilim & Açık Erişim

Araştırma Verisi Yönetimi

Veri yönetimi nedir?

“​Veri Yönetimi, verinin güvenli, verimli ve uygun maliyetli bir şekilde toplanması, saklanması ve kullanılması uygulamasıdır. Veri yönetiminin amacı, insanların, kurumların ve bağlantılı araçların, verinin politika ve düzenleme sınırları kapsamında kullanımını optimize etmelerine yardımcı olmaktır. Böylece işletmeye en yüksek düzeyde fayda sağlayacak kararlar alabilir ve bunları hayata geçirebilirler. Kurumlar değer yaratmak için maddi olmayan varlıklara giderek daha fazla güvendikleri için güçlü bir veri yönetimi stratejisi her zamankinden daha önemli hale geliyor.

Bir kurumdaki dijital veriyi yönetmek, çok çeşitli görevler, politikalar, prosedürler ve uygulamalar gerektirir. Veri yönetimi çalışmaları, aşağıdakiler dahil olmak üzere geniş bir kapsama sahiptir:

* Çeşitli veri katmanlarında veri oluşturma, erişme ve güncelleme

* Veriyi birden fazla bulutta ve tesis içinde depolama

* Yüksek erişilebilirlik ve olağanüstü durum kurtarma sağlama

* Veriyi giderek daha çeşitli hale gelen uygulama yazılımlarında, analitiklerde ve algoritmalarda kullanma

* Veri gizliliği ve güvenliği sağlama

* Veriyi saklama programları ve yasal uyumluluk gereklilikleri uyarınca arşivleme ve imha etme

Resmi bir veri yönetimi stratejisi, kullanıcıların ve yöneticilerin faaliyetlerini, veri yönetimi teknolojilerinin becerilerini, yasal gereklilikleri ve kurumun veriden değer elde etmek için ihtiyaçlarını kapsar. ” Kaynak

Verileri Niçin Yönetmelisiniz?

“Araştırmanızı yeniden üretilebilecek şekilde düzenlemelisiniz. Verilerinizi yönetmek, projenin yaşam döngüsü boyunca verileriniz ve veri toplamanızla ilgili ayrıntıları ve prosedürleri anlamayı kolaylaştırır.

Tanınmak için verilerinizi korumalı ve paylaşmalısınız. Topladığınız veriler araştırmanızın temelini oluşturur. Bunlar sizin araştırmaya olan benzersiz katkılarınızdır ve onları korumak çalışmanızın başkaları tarafından tanınması anlamına gelir. Ayrıca bunlar çalışmanızın gelecekteki araştırmaları desteklemesini ve yeni keşifleri kolaylaştırmasını sağlar.

Fon gereksinimlerini ve araştırma politikalarını karşılamalısınız. Verilerin korunmasını ve paylaşılmasını gerektiren yetkilendirme organlarının sayısı artmaktadır. İyi bir veri yönetimi planı, finansmanınızın gereksinimlerini karşılamanıza ve koruma, dokümantasyon ve doğrulama sorunlarını ele almanıza yardımcı olacak, çalışmanızı inceleyenlerin verilerinizin özelliklerini anlamalarına yardımcı olacaktır.” Kaynak, Türkçe çeviri 

Araştırma Verisi Tanımı ve Türleri

Araştırma verisi

Araştırma verisi için üzerinde fikir birliğine varılmış bir tanım bulunmamaktadır. Alana, disipline, yapılan araştırma ve çalışmalara bağlı olarak araştırma verisi farklı şekillerde tanımlanabilmektedir. Araştırma verisi yeni bir kavram olmamakla birlikte, 2000’li yılların başında akademik literatürde özellikle veri yönetimi ve veri yönetim politikaları bağlamında gündeme gelmiş ve kavramsal olarak tanımlanması ihtiyacı doğmuştur.

Araştırma verisi, Açık araştırma verisi ve Açık veri sıklıkla birlikte anılıyor olmasına rağmen aynı anlama gelmemektedir.

Araştırma verisi, yapılan bilimsel araştırmalarda kullanılan, genellikle dijital formatta olan ve orijinal araştırma sonuçlarına ulaşmayı sağlayan verilerdir [1]. Araştırma verileri ile ilgili çok sayıda tanımlama yapılmıştır. Bu tanımlamaların büyük kısmında, “araştırma bulgularının doğrulanmasını sağlayan veriler” vurgusu dikkat çekmektedir. Örnek olarak, UKRI Engineering and Physical Sciences Research Council‘ın araştırma verisi tanımı verilebilir [2].

Açık araştırma verisi, bilimsel araştırma sonuçlarını destekleyen araştırma verilerine erişimde herhangi bir kısıtlama olmaması ve bu verilere herkes tarafından erişilebilmesini ifade eder [34].

Araştırma verilerinin kaynağı

Veriler çok farklı kaynaklardan geliyor olabilir. Kaynaklarına göre dört temel veri grubu gözlem verisi, deneysel veri, simülasyon verisi ve türetilmiş/derlenmiş veridir.

1. Gözlem verisi: Gerçek zamanlı olarak toplanan verilerdir. En bilinen örneği, anketler aracılığıyla toplanan verilerdir. Sensörler tarafından toplanan veriler, görüntü verileri de gözlem verilerinin diğer örnekleridir. Gerçek zamanlı toplanması sebebiyle aynı verinin yeniden aynı formda üretilmesi genellikle mümkün değildir. Bu yönüyle korunması büyük önem taşımaktadır.

2. Deneysel veri: Kontrollü bir ortamda ve genellikle laboratuvar ortamında toplanan verilerdir. Gen dizilim verileri ve manyetik alan okumaları deneysel verilere örnek olarak verilebilir. Yeniden üretimi çoğunlukla mümkün olmakla birlikte, bunun maliyeti oldukça fazla olabilmektedir.

3. Simülasyon verisi: Mevcut test modellerine dayalı olarak makina tarafından üretilen verilerdir. Girdilerin ve modellerin korunması yeniden üretimini mümkün kılmaktadır. Üst veri, simülasyon verisi için oldukça önemlidir. Simülasyon verisi örnekleri ekonomik veriler ve iklim verileridir.

4. Türetilmiş/derlenmiş veri: Mevcut veri setlerinden türetilmiş, yeniden üretilmesi mümkün ancak maliyetli olan verilerdir. Metin ve veri madenleme teknikleri ile türetilen veriler ile veri tabanlarından elde edilen veriler bu kapsamdadır. Ayrıca, 3D modeller de türetilmiş veriye örnektir.

Verinin biçimi

Veriler birçok farklı şekilde olabilir. bunlardan bazıları şunlardır:

  • Metin verisi: alan ya da laboratuvar notları, anket yanıtları (Word, PDF, RTF, XML)
  • Numerik veri: tablolar, sayılar, ölçümler (SPSS, Stata, Excel)
  • Görsel-işitsel veri: görüntüler, ses kayıtları, videolar (jpeg, tiff, mpeg)
  • Disipline özel veri: Astronomide FITS, kimyada CIF
  • Cihaza özel veri: Ekipman çıktıları
  • Modeller: 3D modeller ya da istatistiksel modeller
  • Yazılımlar: Java, C

Verinin durağanlık anlamındaki yapısı

Veri değişmez olabileceği gibi araştırma esnasında değişmesi de mümkündür. Bu değişim, verinin artması ya da düzeltilmesi şeklinde olabilir. Verinin durağanlık yapısını doğru belirlemek, veri organizasyonu ve veri sürümlerinin oluşturulması ile ilgili kararı da etkileyeceğinden veri yönetiminin planlaması açısından oldukça önemlidir.

  • Sabit veri: toplandıktan sonra hiç değişmez
  • Gelişen/büyüyen veri: yeni veri eklenebilir, ancak önceki veri hiç değişmez ya da silinmez
  • Düzeltilebilir veri: yeni veri eklenebilir, önceki veri değişebilir ya da silinebilir.

Verinin hacmi

Çalışmada kullanılacak/elde edilecek verinin hacmini tahmin edebilmek, veri yönetimi açısından kritik önem taşır. Örneğin, görüntü verisi, oldukça fazla depolama alanı gerektirir.  Bu nedenle, tüm görüntülerin depolanıp depolanmayacağı, depolanacak görüntülerin nasıl seçileceği, görüntü verilerinin nerede depolanacağı, kurum/fon sağlayıcı arşivinin depolama için yeterli olup olmadığına yönelik planlamanın zamanında yapılması gerekir. ” Kaynak

Veri yönetimi planı nedir ?
“Veri Yönetim Planı (DMP), bir araştırma projesi sırasında ve sonrasında araştırma verilerinin nasıl ele alınacağını belirten resmi bir belgedir. Araştırma verilerinin güvenli, sürdürülebilir ve – mümkünse – erişilebilir ve tekrar kullanılabilir olmasını sağlamak için anahtar eylemleri tanımlar. DMP ‘yaşayan’ bir belge olarak düşünülmelidir – ideal olarak bir araştırma projesinin öncesinde veya başında oluşturulur, ancak proje ilerledikçe gerektiğinde güncellenir. Veri yönetimi için planlama bir kerelik bir olay değil, bir süreçtir. Yardımcı olması için DMP şablonları kullanıma sunulmuştur. Avrupa Komisyonu tarafından sağlanan H2020 projeleri için DMP şablonları şunları içerir:
  • Verilerinizin bir özeti
  • Verilerinizin nasıl FAIR İlkelerine uygun hale getirildiği hakkında bilgi
  • Maliyetler ve kaynaklar hakkında bilgi
  • Veri güvenliği hakkında bilgi
  • Etik yönler
DMPonline, Horizon 2020 gibi farklı fon sağlayıcıların ve kurumların gereksinimlerini temsil eden bir dizi şablon sağlayan çevrimiçi bir araçtır. Ayrıca şablona özgü soruları anlamak ve cevaplamak için daha fazla rehberlik sağlar. DMPonline ile oluşturulan planlar ortak çalışanlarla kolayca paylaşılabilir ve çeşitli formatlarda dışa aktarılabilir.
DMPonline kurulumlarına buradan göz atabilirsiniz.” Kaynak, Türkçe çeviri

Araştırma verilerinin yönetimi için Ufuk Avrupa’ya (Horizon Europe) nasıl uyum sağlanır ?

Gereklilikler nelerdir?
Uygun Araştırma Veri Yönetimi (RDM), araştırma verisi üreten veya yeniden kullanan tüm Horizon Europe projeleri için zorunludur. Ufuk Avrupa’nın açık bilim gerekliliklerinin önemli bir parçasıdır.

Ufuk Avrupa fonlarından yararlananlar, FAIR ilkeleri doğrultusunda araştırma sürecinde üretilen dijital araştırma verilerini sorumlu bir şekilde yönetmeli ve en azından aşağıdakileri yapmalıdır:

  • Bir Veri Yönetim Planı (VYP) hazırlamak ve proje süresince bunu güncel tutmak
  • Verileri güvenilir bir kurumsal arşivde depolamak ve bunların açık erişim olmasını sağlamak (‘mümkün olduğunca açık, gerektiği kadar kapalı’)
  • Verilerin yeniden kullanılması veya doğrulanması için gereken her türlü araştırma çıktısı veya diğer araç ve gereçler hakkında (aynı kurumsal arşiv aracılığıyla) bilgi sağlamak

‘Araştırma verilerinin’ çok geniş bir kavram olduğunu ve kesinlikle sayısal/tablosal verilerle sınırlı olmadığını unutmayın. Kaynak

Ufuk Avrupa ve FAIR ilkeleri
Ufuk Avrupa, verilerin ve diğer çıktıların FAIR ilkelerine uygun olarak yönetilmesini vurgular; bu da verilerin Bulunabilir, Erişilebilir, Birlikte Çalışabilir ve Yeniden Kullanılabilir hale getirilmesi anlamına gelir. Bu ilkeler, araştırma verilerine hem insanlar hem de makineler tarafından yeniden kullanılmalarını sağlayan ve geliştiren bir dizi nitelik sağlar.

Verilerin güvenilir bir kurumsal arşiv aracılığıyla erişilebilir hale getirilmesi, FAIR ilkelerine uyum sağlamada yardımcıdır.

Araştırma verilerini yönetmenin ve onları FAIR yapmanın tek ve herkese uyan bir yolu yoktur. Neyin uygun ve uygulanabilir olduğu büyük ölçüde araştırma alanına, ilgili veri türlerine ve projenin özelliklerine bağlıdır. Kaynak

Bir Veri Yönetim Planı (VYP) Geliştirme
Ufuk Avrupa’daki “araştırma verisi yönetimi” gerekliliklerine uymanın ilk adımı bir Veri Yönetim Planı (VYP) geliştirmektir.

VYP, projenin başlangıcından itibaren araştırma verilerinin bir araştırma projesi sırasında ve sonrasında nasıl ele alınacağını özetleyen bir belgedir. Araştırma verilerinin yüksek kalitede, güvenli, sürdürülebilir ve – mümkün olduğu ölçüde – erişilebilir ve yeniden kullanılabilir olmasını sağlamak için temel eylemleri ve stratejileri tanımlar.

VYP zaman çizelgesi

VYP ne zaman hazır olmalıdır?

  • Teklif aşamasında kısa (1 sayfalık) bir VYP gereklidir.
  • VYP’nin tam, ilk versiyonunun normal şartlarda ilk 6 ay içinde teslim edilebilir olarak gereklidir.
    • Not: İstisnai olarak, kamusal bir acil durum söz konusu olduğunda ve çalışma programı gerektiriyorsa, tekliflerin sunulmasıyla birlikte veya en geç hibe sözleşmesinin imzalanmasına kadar tam bir VYP sunmalısınız.
  • VYP ‘yaşayan bir belge’ olarak kabul edilir ve ortaya çıkabilecek değişiklikleri veya uygulanan kararları yansıtmak için düzenli olarak güncellenmelidir. On iki aydan uzun süreli projeler için, VYP’nin güncellenmiş bir versiyonunun proje teslimatı olarak paylaşımı yapılmalıdır.
  • Verilerin nasıl yönetildiğini ve paylaşıldığını açıklayanVYP’nin son versiyonu proje sonunda teslim edilmelidir.

Mümkün olduğunda, fon yararlanıcılarının VYP’lerini kısıtlamasız, kamuya açık, açık erişimli ve CC BY lisansı altında, geniş bir yeniden kullanıma izin verecek şekilde hazırlamaları teşvik edilir. Örneğin, H2020’deki birçok Avrupa projesi, VYP’lerini Zenodo arşivi aracılığıyla erişime açmıştır. Buna ek olarak, VYP, AB CORDIS web sitesinde çıktıların bir parçası olarak sunulabilir.

Bir VYP’ye neler dahil edilmelidir?

Projenizin VYP’sini hazırlamak için Ufuk Avrupa bir VYP şablonu sunmaktadır. Bu şablonun kullanılması tavsiye edilir ancak zorunlu değildir.

Hem Ufuk Avrupa teklifinizi hem de tam VYPP’nizi hazırlamanıza yardımcı olması için OpenAIRE’in VYP yazma ve yayınlamaya yönelik açık kaynak hizmeti olan Argos çevrimiçi planlama aracını kullanabilirsiniz.

Bu araç, Ufuk Avrupa gereklilikleriyle uyumlu şablonlar ve şablondaki her bir soru için özel rehberlik sunar. Kaynak

Güvenilir veri arşivlerinde araştırma verilerine erişim sağlanması

Güvenilir arşivler

Güvenilir veri arşivleri, yayın vb. dijital kaynaklara güvenilir ve uzun vadeli erişim sağlayan altyapılardır. Genellikle bu arşivler, belirli kalite kriterlerinin karşılandığını garanti etmek için değerlendirme veya sertifikasyon süreçlerinden geçer.

Ufuk Avrupa’da aşağıda listelenen veri havuzları güvenilir olarak kabul edilmektedir:

  • Sertifikalı veri arşivleri, örneğin CoreTrustSeal, Nestor Seal DIN31644 veya ISO16363 sertifikalarına sahip olanlar.
  • Uluslararası olarak tanınan, yaygın olarak kullanılan ve projenizle ilgili araştırma toplulukları tarafından onaylanan alana özgü veri arşivleri.
  • Resmi sertifikasyon olmaksızın güvenilir depoların temel özelliklerini sunan genel amaçlı arşivler veya kurumsal arşivler (örneğin güvenlik hükümleri, makine tarafından işlenebilir üst meta verilerin oluşturulmasına yönelik hizmetler, verilerin uzun süreli korunması, vb.)

Verileriniz için güvenilir bir arşivi nasıl bulacağınız hakkında daha fazla bilgiyi bu sayfada bulabilirsiniz.

Avrupa Açık Bilim Bulutu (EOSC) ile ilgili bir koşulu olan çağrılar için, veriler EOSC federe (EOSC Portalı üzerinden keşfedilebilir) veri arşivlerinde saklanmalıdır.

Veriler ne zaman arşivlenmelidir?

Ufuk Avrupa’da, veriler oluşturulduktan sonra mümkün olan en kısa sürede ve en geç projenin sonuna kadar arşivlenmelidir.

Bununla birlikte, bazı ek gereklilikler vardır:

  • Bilimsel bir yayının temelini oluşturan veriler, en geç yayın sırasında ve standart topluluk uygulamalarına uygun olarak arşivlenmelidir.
  • Kamusal acil durumlarda, izin veren makam tarafından talep edilmesi halinde, derhal açık erişim sağlanmalıdır. Verilere açık erişim için istisnaların geçerli olması halinde, veriler en azından kamusal acil durumu ele almak için verilere ihtiyaç duyan tüzel kişilerin erişimine sunulmalıdır.
  • İstisnai durumlarda, proje bittikten sonra veriler arşivlenebilir.

‘Mümkün olduğunca açık, gerektiği kadar kapalı’
Ufuk Avrupa’da araştırma verileri varsayılan olarak açık erişimli hale getirilmeli ve CC BY (atıf gerekli) veya CC 0 (kamu malı) veya eşdeğerinin en son sürümü altında lisanslanmalıdır.

Bununla birlikte, verilerin ‘mümkün olduğunca açık, gerektiği kadar kapalı’ olması gerektiği ve verilere açık erişim sağlarken istisnalar yapılabileceği kabul edilmektedir:

  • Ticari kullanım da dahil olmak üzere yararlanıcının meşru menfaatlerine aykırı olması;
  • Veri koruma kuralları, gizlilik, mahremiyet, ticari sırlar, Birlik rekabet menfaatleri, güvenlik kuralları, fikri mülkiyet hakları gibi diğer kısıtlamalara aykırı olması veya;
  • Hibe Sözleşmesi kapsamındaki diğer yükümlülüklere aykırı olması.

Bu gibi durumlarda, veriler kısıtlı, kapalı veya ambargo altında tutulabilir, ancak fondan yararlananların, araştırma verilerine (bazılarına) erişimi kısıtlamayı seçtikleri meşru istisnayı/istisnaları VYP’de açıklamalıdır. Araştırma verilerimin korunup korunmadığını nasıl bilebilirim? Sorusunun cevabı için bu sayfayı inceleyebilirsiniz.

Üst veri (Metadata)
Ufuk Avrupa, güvenilir bir veri arşivine veri depoladığınızda, bunun FAIR ilkeleri doğrultusunda zengin üst verilerle tanımlanmasını gerektirir. Üst veriler şunları içermelidir:

  • En azından şu alanları içermelidir: yazar(lar), veri seti açıklaması veya özeti, veri setinin arşivlendiği tarih veya yayın tarihi, veri setinin arşivlendiği yer, veri seti lisansı (varsayılan olarak CC 0 veya CC BY) ve veri seti ambargo süresi (varsa).
  • Ayrıca Ufuk Avrupa veya Euratom finansmanı ile ilgili bilgileri de eklenmesi gerekir: hibe proje adı, kısaltması ve numarası. İdeal olarak, veri arşivinde bu bilgiler için özel alanlar olacaktır. Eğer yoksa, bunları özet gibi diğer uygun alanlara ekleyebilirsiniz
  • CC 0 lisansı veya eşdeğeri altında açık erişimli olmalıdır. Bu, verilerin kapalı veya kısıtlı olması gereken ancak üst verilerin bulunabilir ve erişilebilir olmaması için zorlayıcı nedenlerin olmadığı durumlarda da önerilir.

Çoğu (güvenilir) veri arşivi, yayınlayacağınız veri veya dosyalar hakkında bu gereklilikleri kapsaması gereken bir üst veri formu doldurmanızı isteyecektir.

Ufuk Avrupa, üst verilerin FAIR ilkelerini takip etmesini bekler. Uygulamada bu, üst verilerin standartları izlediği ve Kalıcı Tanımlayıcıları (PID’ler) içeren bir veri arşivi seçmeniz gerektiği anlamına gelir: veri kümesi (örneğin DOI), yazar(lar) (örneğin ORCID veya ResearcherID) ve mümkünse kuruluş(lar) (örneğin ROR) ve hibe (örneğin hibe DOI) için.

Daha fazla bilgi için üst veri sayfasını kontrol edebilirsiniz. Kaynak

Doğrulama (ve yeniden kullanım) gereksinimleri

Ufuk Avrupa, araştırma verilerinin güvenilir bir veri arşivinde depolanması sırasında, araştırma verilerinin yeniden kullanılması veya doğrulanması için gereken her türlü araştırma çıktısı veya diğer araçlar veya enstrümanlar hakkındaki bilgilere de (veri arşivi aracılığıyla) erişim sağlamanızı bekler.

  • “Araştırma çıktıları, araçlar ve enstrümanlar” veri, yazılım, algoritmalar, protokoller, modeller, iş akışları, elektronik not defterleri ve diğerlerini içerebilir.
  • Ne tür bilgiler sağlanmalıdır? Araştırma çıktısının/aracının/enstrümanın ayrıntılı bir açıklaması, buna nasıl erişileceği, ticari ürünlere (örneğin yazılım) olan bağımlılıklar, potansiyel sürüm/tür, potansiyel parametreler vb.
  • Bu çıktılar hakkındaki bilgilerin yanı sıra, meşru menfaatler veya kısıtlamalar söz konusu olmadığı sürece, yararlanıcıların araştırma çıktılarına, araçlarına ve enstrümanlarına açık (dijital) erişim sağlamaları teşvik edilmektedir.

Tipik olarak, veri arşivi ilgili bilgilere bağlantılar sağlamanıza izin verecektir (örneğin, ilgili yayınlara, bir kod deposuna, ilgili veri kümelerine vb. bağlantılar). Kaynak

Araştırma Veri Yönetimi Maliyetleri

Veri yönetimi ve paylaşımı faaliyetlerinin, ihtiyaç duyulan zaman ve kaynaklar açısından araştırmaya dahil edilmesi gerekir. Erken planlama yapılarak maliyetler önemli ölçüde azaltılabilir. Araştırma verilerine açık erişimle ilgili maliyetler, Hibe Sözleşmesinde tanımlanan koşullar altında proje süresince herhangi bir Ufuk Avrupa hibesinin uygun maliyetleri olarak talep edilebilir: ancak bunun için hibe teklifinde zaten bütçelendirilmiş ve kabul edilmiş olmalı ve “proje süresince” ibaresinin olmasına dikkat edilmelidir.

RDM maliyetlerini tahmin etmek için çevrimiçi RDM maliyetlendirme aracına ve “Verilerimi yönetmenin ve paylaşmanın maliyeti ne olacak?” konulu bilgi grafiğine bakabilirsiniz. Kaynak

AÇIK VERİ

“Veriler, herhangi bir amaç için herhangi biri tarafından serbestçe erişilebiliyorsa, kullanılabiliyorsa, değiştirilebiliyorsa ve paylaşılabiliyorsa açıktır – en fazla, yalnızca atıf ve/veya benzeri sağlama gereksinimlerine tabidir. Açık veri el kitabında açık veri “open definition” altında özel olarak tanımlanır ve şunları gerektirir:

A. Yasal olarak açık: yani, herkesin serbestçe erişmesine, yeniden kullanmasına ve yeniden dağıtmasına izin veren bir açık (veri) lisansı altında mevcuttur.

B. Teknik olarak açık: yani, verilerin yeniden üretim maliyetinden daha fazla olmaması ve makine tarafından okunabilir ve toplu biçimde mevcut olması.” (Açık Veri El Kitabı) Kaynak

“Açık Veri, herhangi bir kullanıcının finansal, yasal veya teknik engeller olmadan indirmesine, kopyalamasına, analiz etmesine, yeniden işlemesine, yazılıma geçirmesine veya başka herhangi bir amaçla kullanmasına izin veren, internette serbestçe bulunan araştırma verileridir.

Açık Veri araştırma verisi:

  1. İnternette serbestçe kullanılabilir;
  2. Herhangi bir kullanıcının indirmesine, kopyalamasına, analiz etmesine, yeniden işlemesine, yazılıma geçirmesine veya başka herhangi bir amaçla kullanmasına izin verir;
  3. İnternetin kendisine erişmekten ayrı olarak finansal, yasal veya teknik engeller olmadan erişilir.

Açık Veriler genellikle veri kümeleri, istatistikler, dökümler, anket sonuçları ve bu nesnelerle ilişkili meta veriler dahil olmak üzere bir dizi metin dışı malzeme için geçerlidir. Bu veriler, esasen, araştırma sonuçlarını çoğaltmak ve doğrulamak için gerekli gerçek bilgilerdir. Açık Veri politikaları genellikle, verilerin makineden çıkarılmasına, değiştirilmesine ve meta analizine izin verilmesi gerektiği fikrini kapsar.

Açık Veri:

  • Keşif hızını hızlandırır. Veri kümeleri açıkça kullanılabilir olduğunda, belirli bir sorgulama alanının daha kapsamlı bir resmini oluşturmak için kolayca erişilebilir ve kullanılabilir veya orijinal verileri üretenlerin göremediği bağlantıları ortaya çıkarabilecek veri madenciliği yazılımı tarafından analiz edilebilir.
  • Ekonomiyi büyütür. Araştırmacılar, bilimin ve bilimsel verilerin önemli bir rol oynadığı tüm sektörlerde Açık Veriler yoluyla küresel GDP’ye 3.2 trilyon dolarlık ekonomik çıktı eklenebileceğini tahmin ediyorlar.
  • Buluşları kaçırmamamıza yardımcı olur. Belirli bir veri kümesini kullanmanın veya analiz etmenin çok sayıda yolu vardır. Bir kişiye gürültü gibi görünen şey, başka bir bakış açısı veya analitik teknikle başka biri için önemli bir keşif olabilir.
  • Bilimin ve bilimsel kaydın bütünlüğünü geliştirir. Bulguların altında yatan veriler erişilebilir olduğunda, araştırmacılar birbirlerinin çalışmalarını kontrol edebilir ve sonuçların sağlam bir temel üzerine inşa edilmesini sağlayabilirler.
  • Araştırma topluluğundaki birçok kişi tarafından 21. yüzyılın araştırma kuruluşunun önemli bir parçası olarak tanınmaktadır. ABD Hükümeti gibi araştırma fonlarından yayıncılara kadar, araştırma sürecine dahil olan kurumlar en azından yayınların altında yatan verilerin açıkça erişilebilir olmasını talep etmeye başlıyor.

Açık Veri, aynı zamanda bu sonuçlara olan güvenimizi artırırken araştırma sürecini hızlandırma potansiyeline de sahiptir. Bu devasa ve büyüyen veri gövdesine erişim, kullanım ve iyileştirme, kurumsal araştırmanın merkezinde yer alır.”  Kaynak , Türkçe çeviri

Açık Veri niçin önemlidir?

“Geçtiğimiz birkaç yıl içerisinde Açık Veri, araştırmacılar, akademisyenler ve kütüphaneciler için bir ilgi alanı haline geldi. Her yıl iki katına çıkan bilimsel veri miktarı ile veri setlerine erişim, kullanım ve kürasyonu çevreleyen konular önem kazanmaktadır. Gelişmekte olan veri açısından zengin, araştırmacı güdümlü ortam yeni zorluklar ortaya çıkarmakta ve araştırma sonuçlarının paylaşılması, gözden geçirilmesi ve yayınlanmasında yeni fırsatlar sunmaktadır. Birincil araştırma verilerine erişimin sağlanması, bilimsel iletişim sisteminin bilim adamlarının ve bir bütün olarak akademik girişimin ihtiyaçlarını destekleyecek şekilde geliştiğini görmede önemli bir rol oynayacaktır.

Kamu ve özel araştırma fonlarından yükseköğretim kurumlarına kadar araştırmayı destekleyen tüm kurumlar, araştırmacıların verilerini nasıl ve ne şekilde sunabileceklerini açıkça kapsayan veri yönetimi planları üretmeleri ile ilgili politikaları araştırmaktadır.

Sonuçları kapsamlı bir şekilde iletmek ve araştırma verilerini geniş çapta erişilebilir ve tamamen yeniden kullanılabilir hale getirmek, mevcut verilerin yeniden analizi yoluyla yeni araştırmaları teşvik ederek araştırma yatırımının değerini daha da artırır. Tam olarak yeniden kullanılabilirliği sağlayan şartlar altında erişilebilir hale getirilen verilere erişim sağlamak, birlikte çalışabilirliği teşvik eder, ve veriler kapatıldığında veya silindiğinde ortaya çıkarılamayan bağlantıları, eğilimleri ve kalıpları bulmak için büyük miktarlardaki verilerdeki en yeni hesaplama araçlarını kullanarak verilerin çıkarılmasını sağlar.” Kaynak , Türkçe çeviri

FAIR İlkeleri

Kaynak

“Dijital bilimin ilerlemesi, dijital verilerin zamanında paylaşımı ve erişilebilirliği ile gelişir. Buna göre, Açık Bilim’de bilim uygulamalarının sistemik bir şekilde değiştirilmesini sağlayan altyapıların ve hizmetlerin geliştirilmesi ihtiyacı artık hem araştırma hem de finansman kuruluşları tarafından güçlü bir şekilde savunulmaktadır.
FAIR İlkeleri bu gelişmeleri güçlendiriyor. Sonuç olarak, araştırma enstitüleri, fon sağlayıcılar ve yayıncılar araştırma veri yönetimi ve araştırma verilerini yeniden kullanmak için taleplerini önemli ölçüde artırmıştır. Avrupa Komisyonu’nun Açık Araştırma Verisi Pilot Uygulamasında, finanse edilen araştırmacıları verilerinin sağlıklı bir şekilde yönetilmesini ve daha sonra paylaşılmasını sağlamaya teşvik etmek için FAIR ilkeleri uygulanır.” Kaynak

Açık Veri Arşivleri ve Açık Veri Portalları Kaynak

Açık Veri Arşivleri

Açık Veri Portalları

Konu rehberi içeriğine ilişkin izlemenizi önerdiğimiz video kayıtları:

Açık Veri Nedir, Bilimi Nasıl Destekler? – 1. Oturum | EELISA İTÜ 26 Ekim 2022

[Açık Kürsü] 14. Bölüm: “Açık Veri Nedir, Ne Değildir?” – Doç. Dr. Şahika Eroğlu 12 Temmuz 2021