近日,OpenAI的一名前研究人员的死亡引发了业界哗然。死者是26岁的Suchir Balaji,曾帮助收集和整理用于训练ChatGPT聊天机器人的大量互联网数据。三个月前,Balaji公开指控OpenAI在开发ChatGPT时违反美国版权法,而他所掌握的资料本来将在针对OpenAI的诉讼中发挥重要作用。
旧金山警方和法医办公室表示,Suchir Balaji于11月26日被发现死在他的公寓内。警方发言人说,当天下午1点左右,警方接到一个电话,要求警员前往公寓查看他的状况。法医确定死因是自杀。警方本周表示“目前没有他杀的证据”。
ChatGPT是一种生成式AI程序,已成为全球数亿人使用的热门赚钱产品。2022年末它的公开发布引发了作家、计算机程序员和记者对OpenAI的大量诉讼,他们称该公司非法窃取并使用了自己的内容,案值逾1500亿美元。
在11月18日提交给联邦法院的一封信中,一家状告OpenAI的报纸的律师将Balaji列为拥有相关文件的人,这些文件将支持他们对OpenAI的诉讼。Balaji是该报纸在法庭文件中提到的至少12人之一(其中许多人是OpenAI的前任或现任员工),这些人拥有对案件有帮助的材料。
Balaji曾在10月23日接受外媒采访,称OpenAI正在损害一些企业和创业者的利益,因为他们的数据被用于训练ChatGPT。“如果你的看法和我一致,你肯定会离开这家公司,对于整个互联网生态系统来说,这不是一个可持续的模式。”他告诉媒体。
Balaji曾美国加州大学伯克利分校学习计算机科学。就在那时,他开始相信人工智能可以为社会带来好处,包括治愈疾病和延缓衰老等等。“我认为我们可以发明某种科学家来解决这些问题,”他告诉媒体。
但他的看法在2022年开始转变,那时他已经在OpenAI担任研究工作两年了。他特别担心自己为公司开发的GPT-4项目从互联网上收集数据的行为,这个项目分析了几乎整个互联网的文本来训练其AI程序。他告诉媒体,这种做法违反了美国关于人们如何使用先前已发表作品的“合理使用”法律。
10月下旬,他发表文章来阐述这一观点。文中写道:“似乎不能证明ChatGPT对其训练数据的使用是合理使用。本文的重点也不是要从根本上针对ChatGPT,在很多领域的很多生成式AI产品都有这个问题。”
Balaji的母亲对媒体表示,她为儿子的去世深感悲痛。
OpenAI在2022年末发布ChatGPT,它推动了AI行业的发展。不少知名公司现在都在AI领域发展,或者制造运行这些程序所需的计算机芯片。OpenAI公司的价值在过去一年中几乎翻了一番。
微软与OpenAI有业务往来,一些报纸起诉这两家公司抄袭并窃取了他们的文章,破坏了他们的商业模式。“微软和OpenAI拿走了记者、新闻工作者、社论作者、编辑以及其他为当地报纸工作的人的劳动成果——完全不考虑那些创造和发布新闻的人的努力,更不用说他们的合法权利了,”这些报纸在诉状中称。
OpenAI坚决驳斥了这些说法,强调其所有工作在“合理使用”法律下仍然是合法的。OpenAI当时曾表示:“我们看到像ChatGPT这样的AI工具在加深出版商与读者的关系以及增强新闻体验方面具有巨大潜力。”
如今AI 快速发展,数据的获取和使用一直是备受关注的话题。媒体认为,Balaji 事件将进一步提高公众对 AI 公司如何使用和挖掘数据的关注,促使人们思考如何在推动技术创新的同时确保数据的合理使用。