
Peretas terkenal George Hotz (pertama kali membobol iPhone saat berusia 17 tahun, telah melakukan rekayasa balik PlayStation 3 sebelum Sony menuntut, penulis framework pembelajaran mendalam Tinygrad open source) pada 25 Mei memublikasikan artikel blog berjudul《The Eternal Sloptember》, yang mengklaim bahwa “menerapkan AI agen untuk pengembangan perangkat lunak akan menjadi salah satu kesalahan paling mahal yang pernah terjadi dalam sejarah bidang ini.
核心論點:高低績效團隊的不對稱輸出問題
Hotz 的論點建立在組織結構差異上:高績效團隊擁有足夠緊密的回饋機制,能夠發現代理生成的問題;低績效團隊缺乏自我檢查機制,卻「利用代理實現了比以往高出十倍的產出」。在大型科技公司中,他預測結果是「程式碼品質平均水準的快速下降,而這種下降卻被龐大的程式碼量所掩蓋」,最終導致「大量劣質產品氾濫成災,優質產品黯然失色」。他舉例:報導稱蘋果正在其整個工程團隊中推廣 AI 編碼工具,他直接問道:「你認為未來兩年 macOS 會變得更好還是更糟?」
六個月測試的具體結論與 Hotz 的立場歸屬
Hotz 表示在測試中,代理「會預先完成所有工作,遞給你一個老虎機拉桿——你拉動它,然後祈禱剩下的工作能夠順利完成。它始終無法完全實現。」他嘗試了讓模型自動處理代碼、工程師審核輸出的模式,但表示「每次都必須手動修改」。他將自己歸入 Meta 首席 AI 科學家 Yann LeCun 和 AI 批評者 Gary Marcus 的陣營,認為語言模型本質上是複雜的模式匹配器,無法解決真正的新問題。
業界分歧:Karpathy 和 Amodei 的對立立場
Andrej Karpathy 曾在 2025 年初對代理持懷疑態度,但在新模型發布後改變立場,於 5 月 19 日加入 Anthropic 預訓練團隊,稱接下來幾年的工作為「意義非凡的成長經驗」。Dario Amodei 在達沃斯表示,部分 Anthropic 工程師已停止編寫代碼而讓模型處理。微軟 CEO Satya Nadella 也將 GitHub Copilot 向代理系統的轉型定義為平台層面的變革。
常見問題
Apakah argumen Hotz menargetkan penggunaan alat AI oleh semua insinyur?
Tidak. Hotz menyatakan dengan jelas bahwa masalahnya bukan pada rasa “digantikan”, melainkan pada efek ukuran organisasi: insinyur berperforma tinggi mampu mengenali keluaran masalah dari agen, sementara insinyur berperforma rendah tidak mampu. Kritiknya ditujukan pada efek penurunan kualitas kode secara menyeluruh ketika tim berperforma rendah menggunakan agen dalam jumlah besar.
Hotz 提到的「越來越難以察覺」的問題具體指什麼?
Hotz 表示「輸出結果存在問題,但這種問題越來越難以察覺,這正是我們對一個日益精確的統計模型所預期的」。問題不在於代理產生明顯的錯誤,而在於產生外表正確但內在存在缺陷的代碼,缺乏足夠能力的工程師無法識別這些問題。
Perbedaan pendapat Hotz dan Karpathy melambangkan apa?
Keduanya adalah insinyur dengan reputasi kuat di industri yang mengambil posisi yang berseberangan: Hotz berpendapat bahwa agen pengkodean berbasis AI adalah bencana, sedangkan Karpathy (telah bergabung dengan Anthropic) menilai bahwa agen telah mengubah pengembangan perangkat lunak secara menyeluruh. Perbedaan mereka mencerminkan bahwa industri saat ini belum mencapai kesimpulan tentang manfaat nyata agen pengkodean AI.