Nisan 27, 2024

PoderyGloria

Podery Gloria'da Türkiye'den ve dünyadan siyaset, iş dünyası

Google, yapay zekasını eğitmek için herkese açık verilerin adil bir oyun olduğunu söylüyor • The Register

Google, yapay zekasını eğitmek için herkese açık verilerin adil bir oyun olduğunu söylüyor • The Register

Google, yapay zeka modellerini ve hizmetlerini (Chatbot Bard ve artık sorgulara hızlı yanıtlar sağlayan arama motoru dahil) eğitmek için internetten herkese açık verileri sıyırdığını doğrulamak için gizlilik politikasını güncelledi.

the iyi baskı Şu anda araştırma ve geliştirme aşamasında olanlar şunlardır: “Google, bilgileri hizmetlerimizi iyileştirmek ve kullanıcılarımıza ve kamuya fayda sağlayan yeni ürünler, özellikler ve teknolojiler geliştirmek için kullanır. Örneğin, Google AI modellerini eğitmeye yardımcı olmak için herkese açık bilgileri kullanırız ve Google Translate, Bard ve Cloud AI gibi ürünler ve özellikler oluşturun. “

Google AI modellerini eğitmeye ve ürün ve özellikler oluşturmaya yardımcı olmak için herkese açık bilgileri kullanırız

İlginç bir şekilde, kayıt Amerika Birleşik Devletleri dışındaki çalışanlar, yukarıdaki bağlantıda alıntılanan metni göremedi. ama Bu bir PDF dosyasıdır Google’ın politika sürümü şunu belirtir: “Google AI modellerini eğitmeye ve Google Çeviri yetenekleri, Bard ve Cloud AI gibi ürün ve özellikler oluşturmaya yardımcı olmak için çevrimiçi olarak veya diğer kamuya açık kaynaklardan halka açık bilgiler toplayabiliriz.”

Değişiklikler, Google’ın yapay zeka eğitimi kapsamını tanımlar. Önceden, politika yalnızca “dil modelleri”nden bahsediyordu ve Google Çeviri’den bahsediyordu. Ancak ifade, “yapay zeka modellerini” içerecek şekilde değiştirildi ve Bard ile bulut platformunda uygulamalar olarak oluşturulan diğer sistemleri içerecek.

Bir Google sözcüsü söyledi kayıt Güncellemenin, AI modellerini eğitme şeklini temelden değiştirmediği.

“Gizlilik Politikası, Google’ın Google Translate gibi hizmetlerin dil modellerini eğitmek için açık web’deki herkese açık bilgileri kullandığı konusunda uzun süredir şeffaftır. Bu son güncelleme, Bard gibi daha yeni hizmetlerin de dahil edildiğini gösteriyor. Gizlilik ilkelerini ve gizlilik korumalarını AI ilkelerimiz doğrultusunda AI teknolojilerimizin geliştirilmesi” sözcüsü yaptığı açıklamada.

Geliştiriciler, yıllardır yapay zeka sistemleri için eğitim verileri toplamak üzere İnternet’i, fotoğraf albümlerini, kitapları, sosyal ağları, kaynak kodunu, müziği, makaleleri ve daha fazlasını kazıp çıkarıyor. Bununla birlikte, materyal genellikle telif hakkı, kullanım koşulları ve lisanslarla korunduğundan ve her şey davalarla sonuçlandığından, bu süreç tartışmalıdır.

Bazı insanlar, içeriklerinin yalnızca işlerini kopyalayan ve böylece potansiyel olarak geçim kaynaklarını tehlikeye atan makine öğrenimi sistemleri oluşturmak için kullanılmasından değil, aynı zamanda bu eğitim verilerini değiştirmeden kusarak modellerin çıktılarının telif hakkı veya lisans ihlaline çok yaklaşmasından da mutsuzdur.

AI geliştiricileri, çabalarının adil kullanım kapsamına girdiğini ve model çıktılarının orijinal eğitim verilerinin bir kopyası değil, yeni bir çalışma biçimi olduğunu iddia edebilir. hararetle tartışılan bir sorundur.

Örneğin, Uluslararası Af Örgütü, Getty Images tarafından, metinden görüntüye araçları eğitmek için stok görüntü web sitesinden milyonlarca görüntüyü toplayıp kötüye kullanmaktan dava açtı. Bu arada, OpenAI ve sahibi Microsoft, “İnternet’ten 300 milyar kelimeyi” ve “izin alınmadan elde edilen kişisel bilgiler dahil olmak üzere kitapları, makaleleri, web sitelerini ve yayınları” uygunsuz bir şekilde kazımakla suçlayan çok sayıda davayla karşı karşıya kaldı. AI-pair programlama aracı GitHub Copilot’u oluşturmak için genel havuzdan kaynak kodu.

Bir Google temsilcisi, reklamcılık ve arama devinin sistemlerini eğitmek için kamuya açık telif hakkıyla korunan verileri, lisanslı verileri veya sosyal medya gönderilerini rafa kaldırıp kaldırmayacağını söylemeyi reddetti.

Artık insanlar yapay zeka modellerinin nasıl eğitileceği konusunda daha iyi bilgilendirildiğine göre, bazı internet şirketleri geliştiricilerden verilerine erişim için ücret almaya başladı. taşma yığını, redditve Twitter, örneğin bu yıl, içeriklerine API’ler aracılığıyla erişmek için yeni ücretler veya kurallar getirdi. Shutterstock ve Getty gibi diğer siteler, görsellerini AI modellerinin yaratıcılarına lisanslamayı seçtiler ve aşağıdakiler gibi şirketlerle ortaklık kurdular: meta Ve nvidia. ®