Post-it #9: TikTok'un gizli ısıtma sistemi, ChatGPT'nin panzehiri, E-posta'nın geleceği

Her hafta olmasa da en azından ayda üç bülten yayımlama istikrarını sağlamış görünüyorum. Bu sayı tek maile sığmayabilir, kesilen yerden genişletilmiş görünüme göz atabilirsiniz. İyi okumalar!

Jan 29, 2023

Bültenin zaman zaman spam kutusuna düştüğüne dair geri dönüşler alıyorum. Bülteni “spam değil” olarak işaretleyerek gelen kutunuza taşıyabilirsiniz.

ChatGPT tarafından üretilen metinleri saptamak

Post-it'in 5. sayısında olduğu gibi bu sayıda da, gündeme paralel olarak ChatGPT'ye geniş yer ayırdım. Bu bölümde ChatGPT özelinde ve aslında diğer sohbet botlarında da sıkça tartışılan ve daha sık tartışılması da muhtemel olan intihal bağlamındaki gelişmeleri aktarmak istedim. Özellikle Kasım ayında ChatGPT deneme sürümünün kullanıcılara açılmasının ardından, konuyla ilgili yayımlanan pek çok içerikte yapay zekâ tarafından üretilen metinlere yer verilmişti. Spesifik sorgularla elde edilen ve yazılara entegre edilen bu metinlerin “gerçekçiliğine” dikkat çekilmiş, özellikle eğitim ve öğretimde bu aracın mevcut metotların değişmesine yol açacağına dair görüşler paylaşılmıştı. İntihal bağlamında endişeler yükselirken ChatGPT metinlerinin panzehiri olabilecek araçlarla ilgili de ilerlemeler başladı. Önce sosyal medyada paylaşılan gönderilerle veri tabanı oluşturarak test sürecine giren GPTZero, daha sonra ise içeriklerin benzerlik oranlarını saptayan ve eğitim kurumlarında en sık başvurulan intihal karşıtı yazılım olan Turnitin, konu üzerinde çalışma yaptıklarını duyurdu. Turnitin’in intihal saptama çalışmalarının temel odak noktası, yapay zekânın en olası kelimeyi en olası yerde kullanarak belirli kalıpları tekrarlaması ve insanlar tarafından üretilen metinlerde aynı durumun gözlenmemesi.

Turnitin gelişmeleri ile birlikte sohbet botları tarafından yayımlanan içerikleri tespit etmek için oluşturulan ve şuan kullanımda olan araçların verimliliğinin incelendiği, ZDNet'te yayımlanan habere de değinebiliriz. Haberde, ChatGPT ve yazar tarafından bölüm bölüm oluşturulan metin, üç farklı yapay zekâ tespit aracında (GPT-2 Output Detector - AI Content Detector - AI Content Detection) sınandı. Haberde, metin üzerinde yapılan tespit çalışmaları sırasında GPT-2 Output Detector’un diğerleri arasında öne çıktığı görülüyor. Benzer denemeleri ben de gerçekleştirdim. Kendi hazırladığım metinlerde GPT-2 Output Detector ve AI Content Detection yüksek skorlar sunarken yapay zekânın ürettiği metinlerde zaman zaman yüksek hata paylarını saptadım. Özetlemek gerekirse, GPT-2 Output Detector öne çıksa da bu araçlar henüz güvenilir seviyede verimlilik sunmuyor.

TikTok'un gizli ısıtma sistemi

Geçtiğimiz hafta Forbes'ta yayımlanan Bytedance ve sahibi olduğu TikTok şirketlerinde çalışanlara ve gazete tarafından incelenen belgelere dayandırılan habere göre, TikTok "ısıtıcı" adında uygulama kullanarak istediği içeriği virale dönüştürebiliyor. Platformun başarısı, beklenmeyen içeriklerin algoritma aracılığıyla viral olması sebebine sıklıkla dayandırılıyordu ki "Sizin İçin" sayfasının TikTok'un popüler olmasıyla doğrudan ilişkisi var. Fakat bu uygulama algoritmadan bağımsız olarak; algoritmaların kaçırdığı düşünülen, içerikleri tanıtma planıyla ya da yükselmesini istedikleri influencerları öne çıkarma amacıyla kullanılıyor. Haberde TikTok'un ısıtma sisteminden bağımsız olarak, platformun sayfada kimi içerikleri neden önerdiklerini teknik olarak açıklama planına da değiniliyor.

Hit paylaşım:

Kevin Cannon @multikev

The future of email with ChatGPT.

Share Post-it

Veri gazeteciliği gündemi

Yakın zamanda dikkatimi çeken, veri odaklı haberler ve veri haberi oluşturma sürecinde işe yarayabilecek araçları bu bölümde ele almak istedim.

Medium'da rastladığım yazıda, birçoğu popüler olan ve hâlihazırda takip etsem de derli toplu bir arada bulunmasının keyif verdiği, veri gazeteciliği sürecinde başvurulabilecek kaynakların düzenli olarak güncellendiği geniş bir liste yer alıyor. Bu kaynağı ekliyorum ve ayrıca listede yer almayan henüz incelemeye başladığım ücretsiz bir planı da bulunan Observable isimli veri görselleştirme aracını paylaşıyorum. Observable birçok programlama aracını destekleyerek minumum kodlama süreciyle görselleri oluşturuyor.

Rusya ile ilgili araştırmacı gazetecilik faaliyetleri yürüten bağımsız platform iStories; Rusya'da altyapı kaynaklı ölümleri ve ülke genelinde hizmetlerin yetersizliğini, önümüzdeki yıllarda da yaşanması muhtemel sorunları verilerle ele alan detaylı bir haber yayımladı. Haberde yer alan en dikkat çekici nokta ise harap olan boruların patlamasından dolayı yaşanan can kayıpları...

Görsel, Rusya’da yaşanan altyapı kaynaklı sorunları haritada yansıtıyor. ABD ve Rusya gazetelerinin harita görselleştirme stilleri birbirine çok benziyor.

The Guardian, vergi cenneti adalarda yer alan şirketler aracılığıyla Birleşik Krallık'ta mülk sahibi olan İngilizleri açıkladı. Lewis Hamilton ve BBC yöneticisi gibi tanınmış isimlerin ve milyarderlerin yer aldığı kişilerden bazıları bu yöntemin vergi avantajı sağlamadığını belirtse de bunun aksini savunanların düşünceleri de haberde yer alıyor.

The Guardian’ın resmi verilere dayanarak oluşturduğu görsel Britanyalı deniz aşırı şirket sahiplerinin sayısını gösteriyor.

Bu başlığın son içeriğini gayriciddi bir paylaşıma ayırdım. New York'ta yaşayan Liam Quigley, yaklaşık 10 yıl boyunca yediği dilim pizzaların yerlerini, çeşitlerini ve fiyatlarını not alarak bu notları grafik, tablo ve harita destekli blog paylaşımına çevirmiş. Dilim pizza fiyatlarındaki değişimi gösteren görseli ekliyorum:

Satın alma gücünün karşılaştırıldığı Big Mac endeksini dilim pizzaya uyarlayabilir miyiz?

Haftanın önerileri:

ChatGPT'yi intihal çerçevesinde değerlendirmişken duruma fırsat olarak yaklaşan bir görüşü de paylaşmak istedim. Vice'ta yer alan röportajda; eğitimde ChatGPT'yi yasaklamak yerine benimsemenin, verimlilik sağlayabileceği ve eğitimi derinleştirebileceği düşünceleri yer alıyor. Ayrıca yenilikçi eğitim yaklaşımının, araçların sorumlu bir şekilde kullanımı konusunda farkındalığı artırma ve beceri gelişimini destekleme gereklilikleri de aktarılıyor. Son olarak destek ve yardım istemenin her öğrenci için kolay olmaması ve belirli bir sosyal sermaye gerektirmesi üzerine, bu tip araçların başka birinin görmesinden endişe duymadan, herhangi bir soruyu sorabileceğiniz fırsatlar sunmasına da dikkat çekilmiş.
Nick Cave'in monologlarından ve çoğunlukla performans kayıtlarından hazırlanan "This Much I Know To Be True" belgeselini Mubi'de izlediğimde onun The Red Hand Files bloğunu öğrenmiştim. Hayranlarının "dertlerini" paylaşan zaman zaman ise sorularını yanıtlayan ve bunları The Red Hand Files'ta yayımlayan Nick Cave'in son mektubu ChatGPT ile ilişkiliydi. Bir hayranı, ChatGPT'ye onun tarzında şarkı sözleri yazdırdı ve bu sözler hakkında neler düşündüğünü sordu. Nick Cave ise ChatGPT'nin neden şarkı üretemeyeceğini -her zamanki gibi- kendi tarzında yanıtladı. Harika bir şarkıyı harika yapan nedir?
Sohbet botlarının kullanıcılara zarar verme potansiyeli taşıyan toksik metinleri de içeren devasa veriyle eğitilmesi ve bu riskli metinlerin sohbet botları tarafından kullanıcılarla paylaşılması kronik problemlerden biriydi. Öyle ki, yıllar önce Microsoft'un sohbet botu Tay'in attığı tweetler bu konudaki tartışmaları bir hayli köpürtmüştü. Time dergisinde yer alan habere göre OpenAI; ChatGPT'yi şiddetten, toksik ve cinsiyetçi içeriklerden, ırkçı sözlerden arındırmak için Kenya'da yer alan Sama isimli bir şirket ile çalıştı. Sama daha önce de Google, Meta ve Microsoft gibi şirketlerle iş birliği yaparak kullanıcı verilerini etiketleyen bir sistem kurmuştu. Sama’nın bu süreçte ise ucuz iş gücü olarak görülen Kenya, Uganda ve Hindistan'dan işçileri çalıştırdığı haberde yer alıyor. OpenAI ile ilişkisine geldiğimizde ise, Kenya'da bulunan yaklaşık kırk işçinin saatlik bir ile iki dolar karşılığında çalıştığı, dokuz saatlik vardiyalarında ise bahsi geçen toksik içerikleri etiketledikleri ve günde yaklaşık 200 pasaj okumaları gerektiği aktarılmış. OpenAI ile Sama arasındaki ilişki ve Sama çalışanlarının maruz kaldığı içerikler için linki bırakıyorum.
OpenAI'ın Microsoft ile iş birliği ve ChatGPT'nin gelecekte Google'ın yerini alacağına dair düşüncelerin üzerine -yorum-, Google araştırma topluluğu yapay zekâya yaklaşımları, bu konudaki çalışmaları ve ilkelerini içeren bir rapor yayımladı.
Büyük dil modellerine dayalı gündem devam ederken aynı zamanda bu modelleri temel alarak geliştirilen araçlarla da karşılaşma sıklığımız artıyor. Geçtiğimiz Nisan ayında yayına alınan Elicit'i yakın zamanda inceleme fırsatı buldum. ChatGPT'nin özellikle sorun yaşadığı, ürettiği yanıtların kaynağını paylaşma konusunda Elicit oldukça aşama kaydetmiş görünüyor. Ayrıca çalışmayı düşündüğünüz alanla ilgili araştırma sorularının, daha önce ele alınıp alınmadığını tespit etme sürecine de katkı sağlayabilir.
ChatGPT'nin medya araştırmacılarına nasıl katkı verebileceği üzerine birkaç fikir sunan yazıyı paylaşıyorum. Kısa bir özetle ChatGPT; çıktıları sınıflandırma ve kategorize etme konusunda, mevzuata dayalı bilgiye kolay erişimde, yeni bilgileri ortaya çıkarma potansiyeli ile ve ayrıca literatür taramalarında analiz sürecini hızlandırarak katkı verebilir.
Teknoloji odaklı haberler yayımlayan CNET, kendi oluşturduğu yapay zekâ destekli botu aracılığıyla haberler yayımlamaya başlamıştı. Bu bot aracılığıyla SEO içerikler üreterek gelir yaratmayı planlayan CNET, içeriklerinde yer alan hatalar ve intihaller ile birlikte büyük tepki topladı. Haberlerine önce düzeltme yapan platform, tepkiler dinmeyince planlarına ara verdiğini açıkladı.
Yapay zekâ ile ilgili ayrıntılara değinmişken daha geniş bir perspektiften de bakabilmek adına The Atlantic'te destekleyici, ufuk açıcı bir yazı yer alıyor. "Yapay zeka her şeyi okuduğunda ne olur?" başlıklı yazı kolektif metin hafızamızı ve yapay zekânın sınırlarını birlikte düşünmemize yol açıyor. Bu düşünce gelecekte olabilecekler hakkında da küçük ipuçları sağlayabilir.
Medyascope'ta yer alan "Yapay zekânın insan anatomisiyle imtihanı" yazısı ilgimi çekti. Midjourney'den birçok görsel edinmeme rağmen ellerle ilgili problemi farketmemiştim.
R Programlama Dilinde genellikle API aracılığıyla sosyal ağlardan veri çekmenin yöntemlerine dair yol haritaları içeren yazıları paylaşıyordum. Elbette API kullanmadan da R üzerinde "rvest" kütüphanesiyle, web sitelerinden kolaylıkla metin verileri edinilebilir. Veri kazıma olarak adlandırılan bu işlemi gerçekleştirmek için yol gösterilebilecek yazıyı ekliyorum.
Statsbomb, Dünya Kupası'nda saha içinden topladığı verilerin tümünü ücretsiz bir biçimde kullanıma açtı. Belki kurcalamak isteyenler olabilir. Bu verileri R'da işleyebilmek için "statsbombR" paketi de kullanılabilir. Şöyle bırakıyorum.
Grafikler günümüzde anlatının önüne mi geçiyor ya da grafikler sadece anlatıyı destekleyen bir araç mıdır? Sorularına dair kısa ve sorgulayıcı belki de heveslileri için kışkırtıcı olabilecek yazıyı paylaşıyorum.
Video görüşme uygulamalarının TikTok benzeri filtre eklemeleriyle birlikte, deepfake içerikler yaygınlaşmadan önce her bir kullanıcının görüntüleri deepfake'e dönüşecek gibi görünüyor. Geçtiğimiz yıllarda birçok video görüşme platformu tarafından sağlanan arka plan değiştirme filtresi gerçekliğin yitiminin başlangıcı olsa da kişisel özel alanını paylaşmak istemeyenler için faydalı oluyordu. NVIDIA Broadcast'in göz teması filtresi için ise aynı şeyleri söyleyemeyeceğim. Geçtiğimiz hafta tanıtılan yapay zekâ destekli bu filtreyle birlikte, anlık video görüşmesi sırasında kullanıcılar gözlerini başka yöne çevirse de karşı taraf göz temasının kesildiğini farketmeyecek. İlgili iki (bir - iki) videoyu linkliyorum.
Discord, lise öğrencileri arasında yaygınlaşan; anonim olarak birbirlerini onayladıkları, iltifat ettikleri ve "gaza getirdikleri" uygulama Gas App'i satın aldı.
Geçtiğimiz yıl yayımlanan fakat benim henüz incelediğim, Telegram'ın gazeteciler için kullanımına dair bir söyleşi ve Telegram'ın tarihine dair işe yarayabilecek linlerin yer aldığı içeriği ekliyorum.
The Verge ve New York Dergisinin The Cut masası iş birliğinde, Dating Games isimli podcast serisinin ilk üç bölümü Land of Giants'ta yayımlandı. Çevrimiçi partner bulma uygulamalarında Match Group'un hakimiyeti ve platformların kullanıcı davranışlarını algoritma aracılığıyla nasıl yönlerdiğine dair ilgi çekici bir seri olarak devam ediyor. İlgilenenler için linki ekliyorum.

Son olarak, Twitter'ın haber bülteni formatını destekleyen Revue uygulamasını kaldırması gibi ileride benzer durumun Substack'de yaşanması ihtimalini gözeterek bültenleri kişisel web sayfama eklediğimi belirtmek istiyorum. Burada paylaştığım çoğu içerik arşivleme içgüdüsüyle, aslında her dönem işime yarayabileceğini düşündüğüm; Evernote, Pocket ve sosyal medya hesaplarımın yer işaretlerinde biriktirdiğim haberlerin bir araya gelmesinden oluşuyor. Bu şekilde daha düzenli ve benimle benzer gündemi takip edenler için faydalı olacağını düşünüyorum. Buraya kadar okuduğunuza göre bülteni ilgi duyabileceğini düşündüğünüz arkadaşlarınıza tavsiye edebilirsiniz. Görüşmek üzere...

Post-it #9: TikTok'un gizli ısıtma sistemi, ChatGPT'nin panzehiri, E-posta'nın geleceği

Her hafta olmasa da en azından ayda üç bülten yayımlama istikrarını sağlamış görünüyorum. Bu sayı tek maile sığmayabilir, kesilen yerden genişletilmiş görünüme göz atabilirsiniz. İyi okumalar!

Discussion about this post