迎接以技术为名的春天
研究人员发现,即使使用「干净」的引用参考内容,最先进的模型也会与「幻觉」、「数值推理」和「罕见的主题」等问题「纠缠不清」(在上图中,错误用红色表明)。、 而最后一个例子表明,即使模型输出是正确的,它有时也没有原始引用提供的信息丰富—— 原始引用包含了更多关于表的推理(在上图中,用蓝色显示)。
最后,除了提出的任务,研究人员还表示,希望ToTTo也可以帮助其他任务,如表格的理解和句子的修改。 我们可以发现,BERT-to-BERT模型在「亲近原文本」方面表现最好。 此外,所有模型在挑战集上的性能都相当低,这表明了域外泛化任务还是具有很强的挑战性。 虽然自动指标可以提供一些性能信息,但目前还不足以评估文本生成系统中的「幻觉」现象。 为了更好地理解「幻觉」,研究人员假设差异表明「幻觉」,并手动评估了最高表现基线,以确定目的句子对源表内容的忠实程度。
结果显示,最高表现基线下,出现「幻觉」信息的概率为20%。 这是一个相当低的数字,以笔者的电脑为例,系统是Win 10专业版,安装内存为8GB,通常使用内存超过5GB。 事实上,使用内存要超过5GB很容易,我只是用Chrome浏览器多开了几个网页,就占用1GB以上,同时我下载了一个游戏并使用Office软件。 因此要将使用内存控制在36MB,意味着只能用最基本的系统应用,比如计算器、控制面板和任务管理器。
NTDEV表示,由于禁用太多服务和驱动程序,他连设备管理器都打不开,系统甚至无法报告CPU信息和安装内存。 举个例子,Beep是一个系统文件,可以让电脑扬声器在应用程序请求时发出蜂鸣声;又比如Http.sys是Windows的驱动程序,可让计算机与硬件连接设备进行通信,这意味着驱动程序能直接访问操作系统内部。 不仅如此,他还用“安全模式”禁用了网络驱动程序接口规范(NDIS)。简单来说,NDIS是一种设备驱动程序,可直接与网络接口卡(NIC)或其他适配器硬件进行交互。
最终,系统内存被控制在了36MB,如下图红圈处所示: (编辑:南通站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |