Menü
Ana sayfa
Forumlar
Yeni mesajlar
Forumlarda ara
Neler yeni
Yeni mesajlar
Son aktiviteler
Kullanıcılar
Şu anki ziyaretçiler
Giriş yap
Kayıt ol
Neler yeni
Ara
Ara
Sadece başlıkları ara
Kullanıcı:
Menü
Giriş yap
Kayıt ol
Ana sayfa
Forumlar
Aöf - Açıköğretim Fakültesi
Aof Sohbet
Güncel Haberler...
Büyük Dil Modellerinin Eğitim Kaynaklarında Reddit Zirvede!
JavaScript devre dışı. Daha iyi bir deneyim için, önce lütfen tarayıcınızda JavaScript'i etkinleştirin.
Konuya cevap cer
Mesaj
<p>[QUOTE="Mudanya, post: 318308, member: 229667"]</p><p>ChatGPT başta olmak üzere, piyasaya sürülen Gemini, Llama ve Grok gibi Büyük Dil Modellerinin (BDM) sorgulara yanıt üretirken hangi veri kaynaklarından beslendiği konusu, yapay zeka alanının temel tartışma konularından birini oluşturmaktadır.</p><p></p><p>Statista portalının Haziran ayında yayımladığı ve yılın ilk çeyreğindeki verileri analiz eden araştırma, BDM'lerin alıntı yapma sıklığına göre en çok kullanılan çevrimiçi kaynakları belirlemiştir.</p><p></p><p></p><p></p><p><strong>Kaynak Kullanımında Lider: Reddit</strong></p><p></p><p></p><p>Araştırma sonuçlarına göre, BDM'ler tarafından en çok alıntılanan web sitesi, tartışma ve topluluk odaklı sosyal medya platformu olan <strong>reddit.com</strong> olmuştur. Reddit, bu listede <strong>%40,11</strong> gibi yüksek bir oranla açık ara farkla birinci sırada yer almıştır.</p><p></p><p>Uzmanlar, yapay zekanın resmi veya düzenlenmiş bilgilere kıyasla, <strong>gerçek kullanıcıların doğal dil ve tartışma formundaki verilerine</strong> öncelik vermesinin, modellerin insan dilini daha doğal bir şekilde taklit etme hedefini desteklediğini belirtmektedir.</p><p></p><p>Reddit'i takiben en çok alıntılanan ikinci kaynak ise, editöryal süzgeçten geçen düzenlenmiş makaleleri içeren <strong>Wikipedia</strong> olmuştur (<strong>%26,3</strong>). Bu oran, düzenlenmemiş ve organize olmayan Reddit verilerinin BDM eğitimindeki önemini vurgular niteliktedir.</p><p></p><p>En sık alıntılanan diğer kaynaklar ve oranları şu şekildedir:</p><p></p><ul> <li data-xf-list-type="ul"><strong>Youtube:</strong> %23,5</li> <li data-xf-list-type="ul"><strong>Google:</strong> %23,2</li> <li data-xf-list-type="ul"><strong>Yelp.com:</strong> %21</li> <li data-xf-list-type="ul"><strong>Facebook:</strong> %19,9</li> <li data-xf-list-type="ul"><strong>Amazon:</strong> %18,7</li> <li data-xf-list-type="ul"><strong>Tripadvisor:</strong> %12,4</li> <li data-xf-list-type="ul"><strong>Mapbox.com / Openstreetmap.com:</strong> %11,2</li> </ul><p></p><p></p><p><strong>Veri Paylaşım Anlaşmaları</strong></p><p></p><p></p><p>Yapay zeka modellerinin eğitilmesi amacıyla veri kaynaklarının kullanımı, ticari anlaşmalarla da resmiyet kazanmaktadır. 2024 yılında Google ve Reddit arasında yapılan anlaşma ile Google'ın yapay zeka sistemleri, Reddit'in kapsamlı veri setlerini kullanma hakkı elde etmiştir. Bu anlaşmanın yıllık maliyetinin 60 milyon dolar olduğu bildirilmiştir.</p><p></p><p>Benzer şekilde, Reuters kaynaklı haberler Reddit'in, önde gelen BDM üreticilerinden OpenAI ile de ChatGPT için veri paylaşım anlaşması yaptığını teyit etmektedir. Bu anlaşmalar, Reddit verilerinin günümüz yapay zeka modellerinin çıktılarındaki etkisini <strong>kurumsal düzeyde</strong> pekiştirmiştir.</p><p>[/QUOTE]</p>
[QUOTE="Mudanya, post: 318308, member: 229667"] ChatGPT başta olmak üzere, piyasaya sürülen Gemini, Llama ve Grok gibi Büyük Dil Modellerinin (BDM) sorgulara yanıt üretirken hangi veri kaynaklarından beslendiği konusu, yapay zeka alanının temel tartışma konularından birini oluşturmaktadır. Statista portalının Haziran ayında yayımladığı ve yılın ilk çeyreğindeki verileri analiz eden araştırma, BDM'lerin alıntı yapma sıklığına göre en çok kullanılan çevrimiçi kaynakları belirlemiştir. [B]Kaynak Kullanımında Lider: Reddit[/B] Araştırma sonuçlarına göre, BDM'ler tarafından en çok alıntılanan web sitesi, tartışma ve topluluk odaklı sosyal medya platformu olan [B]reddit.com[/B] olmuştur. Reddit, bu listede [B]%40,11[/B] gibi yüksek bir oranla açık ara farkla birinci sırada yer almıştır. Uzmanlar, yapay zekanın resmi veya düzenlenmiş bilgilere kıyasla, [B]gerçek kullanıcıların doğal dil ve tartışma formundaki verilerine[/B] öncelik vermesinin, modellerin insan dilini daha doğal bir şekilde taklit etme hedefini desteklediğini belirtmektedir. Reddit'i takiben en çok alıntılanan ikinci kaynak ise, editöryal süzgeçten geçen düzenlenmiş makaleleri içeren [B]Wikipedia[/B] olmuştur ([B]%26,3[/B]). Bu oran, düzenlenmemiş ve organize olmayan Reddit verilerinin BDM eğitimindeki önemini vurgular niteliktedir. En sık alıntılanan diğer kaynaklar ve oranları şu şekildedir: [LIST] [*][B]Youtube:[/B] %23,5 [*][B]Google:[/B] %23,2 [*][B]Yelp.com:[/B] %21 [*][B]Facebook:[/B] %19,9 [*][B]Amazon:[/B] %18,7 [*][B]Tripadvisor:[/B] %12,4 [*][B]Mapbox.com / Openstreetmap.com:[/B] %11,2 [/LIST] [B]Veri Paylaşım Anlaşmaları[/B] Yapay zeka modellerinin eğitilmesi amacıyla veri kaynaklarının kullanımı, ticari anlaşmalarla da resmiyet kazanmaktadır. 2024 yılında Google ve Reddit arasında yapılan anlaşma ile Google'ın yapay zeka sistemleri, Reddit'in kapsamlı veri setlerini kullanma hakkı elde etmiştir. Bu anlaşmanın yıllık maliyetinin 60 milyon dolar olduğu bildirilmiştir. Benzer şekilde, Reuters kaynaklı haberler Reddit'in, önde gelen BDM üreticilerinden OpenAI ile de ChatGPT için veri paylaşım anlaşması yaptığını teyit etmektedir. Bu anlaşmalar, Reddit verilerinin günümüz yapay zeka modellerinin çıktılarındaki etkisini [B]kurumsal düzeyde[/B] pekiştirmiştir. [/QUOTE]
Alıntı ekle…
Önizleme yap
Adı
İnsan doğrulaması
Türkiye'nin Başkentinin Plaka Kodu Nedir?
Cevap yaz
Ana sayfa
Forumlar
Aöf - Açıköğretim Fakültesi
Aof Sohbet
Güncel Haberler...
Büyük Dil Modellerinin Eğitim Kaynaklarında Reddit Zirvede!
Üst