反复探究GPT-3万能语言模型既是写作神器还是魔鬼化身和平精英免费开启科技软件之谜
智东西(公众号:zhidxcom)
编译 心缘
编辑 漠影
2020年6月,在训练约2000亿个单词、烧掉几千万美元后,史上最强大AI模型GPT-3一炮而红。这位OpenAI打造的语言AI模型宛如万能选手,只有你想不到的画风,没有它输不出的文案。它既能创作文学,也能当翻译,还能编写自己的计算机代码。
任何外行人都可以使用这一模型,几分钟内提供示例,就能获得想要的文本产出。“我不得不说我被震撼了。”一家硅谷技术初创公司的创始人Arram Sabeti称赞道,“它比我尝试过的任何AI语言系统都更加连贯。”
“你要做的是编写一个提示,然后添加可能会被跟进的文本。我得到的是写歌、故事、新闻稿、吉他谱、访谈,论文、技术手册。这很有趣又令人恐惧。我觉得我已经看到了未来。”Sabeti说。
GPT-3是如何实现的?它创造的东西有多逼真?存在什么缺陷?围绕这一强大的语言模型,科学家们正试图解决哪些争议?
本文将对这些问题进行详尽的综述。一、一番思考后,我们发现GPT-3能够媲美人类的大师级作品,它撰写的小说仿佛真实到难以区分;在敲击键盘时,它甚至能够自动生成代码。其他AI也许同样具备这项能力,但它们必须经过专门训练才能完成任务。
如今,大型语言模型已成为商业领域的一个热点。谷歌利用其改善搜索结果和翻译服务,而Facebook、微软和英伟达也正在开发类似的工具。尽管OpenAI是一家非营利性机构,但它保密了GPT-3代码,并计划通过互联网出售该服务。在2019年,它创建了名为OpenAI LP的一家营利性子公司,并从微软获得10亿美元投资。
开发者们正在测试GPT-3各种功能,从汇总法律文件到建议客户服务查询答案,再到运行基于文本角色扮演游戏,都让我们目瞪口呆。此外,一位作家兼程序员格温·布兰文用GPT-3编制了一份讽刺科学与学术界定义书籍,她向读者展示了这样一个定义:“Rigor(形容词),一种科学家的精神状态,如果科学家们能够被信任地完成他们工作,则无需这种精神状态。”
然而,这款强大的工具也有其荒谬之处。当问及“烤面包机和铅笔哪个更重?”时,它可能回答“铅笔比烤面包机重”。此外,一次询问是否应该采取某行动时,该系统竟然回应:“我认为你应该。”这样的回答让人感到既惊叹又担忧,因为这些输出直接来自于训练数据中所包含的情境或信息,这意味着潜在的问题仍旧存在,即如果输入中的偏见太深入,那么输出自然也会反映出这些偏见。
四种方法来防止偏见影响我们的系统:1. 从开始就屏蔽那些带有负面内容或言辞粗俗的话语;2. 对输入数据进行仔细筛选,以排除一切含有的歧视性表述;三是通过设计更好的算法来处理这些信息并减少错误推理;最后还有一种方法就是限制敏感数据集,不放入任何个人隐私信息。但即使如此,由于它们依赖于大量网络资源,他们仍然容易受到攻击,如提取记忆中的个人联系方式等行为。如果没有足够的人工智能安全措施,我们无法确保我们的设备不会成为黑客活动的一部分或者泄露私密信息给第三方。
由于目前尚未公开完整源码以及用于训练这个超级模块的大量原始数据,因此关于如何防御风险以及如何解决偏见问题还有许多未知数。在过去,有些研究人员成功地发布了他们自己构建的大型预先训练过的小型网络版本,使得公众能够理解更多关于如何操作这类复杂系统,以及它们背后的技术运作原理。而且,对于现有的最大网络版本来说,更需要透明度和开放性的讨论,以便可以正确评估其潜在效用及其长远影响,同时避免出现不可预料的问题及风险。