2023/8/30 14:38:49 阅读:102 发布者:
今日值得关注的人工智能新动态:
OpenAI:企业可用自己的数据微调GPT-3.5 Turbo
谷歌新研究:一句话,机器人就学会了新动作
VMware、NVIDIA扩大战略合作:让数十万家企业使用生成式 AI
IBM首席执行官:如果没有AI,世界将会变得更糟
UniDoc:首个可检测、识别、发现和理解文本的通用大型多模态模型
综述:基于大型语言模型的自主机器人
ProAgent:利用大型语言模型构建主动式合作AI
在大型语言模型时代,打造情感支持聊天机器人
自我欺骗:反向穿透大型语言模型的语义防火墙
01
OpenAI:
企业可用自己的数据
微调GPT-3.5 Turbo
OpenAI 又有了新动作——企业现在可以使用自己的数据对 GPT-3.5 Turbo 进行微调。
OpenAI 表示,通过对聊天机器人进行微调,使其专注于特定任务(如代码完成或保持一致的语气),企业可以让 ChatGPT 成为更高效的工具。OpenAI 声称,由此产生的定制模型在某些任务上可以达到或超过 GPT-4 的能力。
另外,今年秋天晚些时候,OpenAI 将开放 GPT-4 用于同样的目的。
02
谷歌新研究:
一句话,
机器人就学会了新动作
让终端用户能够以交互方式教机器人执行新任务,是机器人成功融入现实世界应用的关键能力。
目前,尽管大型语言模型(LLMs)拥有关于机器人运动的内部知识,但由于相关训练数据的可用性有限,LLMs 很难直接输出低级机器人指令。
该研究提出了一个“从语言到奖励”(language-to-reward)系统,使用户能够直接通过自然语言输入教机器人做新动作,利用 LLMs 将自然语言用户指令翻译成指定奖励的代码,然后应用 MuJoCo MPC 找到最优底层机器人动作,使生成的奖励函数最大化。
研究团队使用一个四足机器人和一个灵巧的机械手机器人,在各种机器人控制任务的仿真中进行了演示。他们还在物理机器人操纵器上进一步验证了这一方法。
03
VMware、NVIDIA扩大合作:
让数十万家企业使用生成式 AI
日前, VMware 和 NVIDIA 宣布,将扩大战略合作伙伴关系,让在 VMware 云基础设施上运行的数十万家企业使用生成式 AI。
据介绍,VMware Private AI Foundation 与 NVIDIA 合作将使企业能够自定义模型并运行生成式 AI 应用程序,包括智能聊天机器人、助手、搜索和摘要。该平台将是一个完全集成的解决方案,配备NVIDIA 的生成式 AI 软件和加速计算,基于 VMware Cloud Foundation 构建并针对 AI 进行了优化。
04
IBM首席执行官:
如果没有AI,
世界将会变得更糟
日前,IBM 首席执行官 Arvind Krishna 在接受 CNBC 采访时表示,人工智能提高工人生产力的能力可以解决许多发达国家面临的“劳动力萎缩”问题。
“如果我看看处于工作年龄的人,他们的工作效率正在下降,所以你需要提高生产力。否则,生活质量就会下降。人工智能是我们得到的唯一答案。”
他还表示,借助人工智能,公司“可以用更少的人完成同样的工作——这就是生产力的本质。”他以人力资源部门为例表示,IBM 现在只需部署 50 名使用人工智能的员工来完成之前需要 700 名员工的工作。此前,IBM 因采用人工智能而暂停了 7800 个岗位的招聘。
05
UniDoc:
首个可检测、识别、发现
和理解文本的通用大型多模态模型
当前,现有的先进算法仅限于有效利用这些大型预训练模型所固有的表示能力和世界知识,而且在文本丰富的场景中,任务之间的有益联系尚未得到充分探索。
该研究介绍了一种具备文本检测和识别能力的多模态模型——UniDoc。据介绍,UniDoc 可以利用任务间的有益互动来提高每个任务的性能。为了实现 UniDoc,研究人员在所提供的大规模指令跟踪数据集上进行了统一的多模态指令调整。
定量和定性实验结果表明,UniDoc 在多个具有挑战性的基准测试中取得了最先进的成绩。这是首个能够同时进行文本检测、识别、发现和理解的大型多模态模型。
论文:
UniDoc: A Universal Large Multimodal Model for Simultaneous Text Detection, Recognition, Spotting and Understanding
06
综述:
基于大型语言模型的自主机器人
自主代理,一直是学术界的一个重要研究课题。该领域以往的研究通常侧重于在孤立的环境中训练知识有限的代理,这与人类的学习过程截然不同,因此这些代理很难做出与人类类似的决策。
为了充分发挥大型语言模型(LLMs)的潜力,业内研究人员针对不同的应用设计了多种代理架构。该研究对这些代理架构进行了全面调查,从整体角度对自主代理领域进行了系统回顾,并提出了一个统一的框架。
此外,该研究总结了基于 LLMs 的人工智能代理在社会科学、自然科学和工程学领域的各种应用,以及基于 LLMs 的自主代理常用的评估策略,面临的若干挑战和未来发展方向等。
论文:
A Survey on Large Language Model based Autonomous Agents
07
ProAgent:
利用大型语言模型
构建主动式合作AI
在人机合作中构建具有自适应行为的人工智能是 AGI 研究的一个关键重点。目前开发合作代理的方法主要依赖于基于学习的方法,在这种方法中,策略泛化在很大程度上取决于过去与特定队友的互动。这些方法限制了代理在面对新队友时重新调整策略的能力。
该研究提出了 ProAgent 框架,它利用大型语言模型(LLMs)能够预测队友即将做出的决定,并为自己制定增强型计划。它擅长合作推理,能够动态调整自己的行为。此外,ProAgent 框架还具有高度的模块化和可解释性,便于无缝集成,以应对各种协调场景。
此外,在与人类代理模型合作时,与目前最先进的 COLE 相比,ProAgent 的性能平均提高了 10% 以上。
论文:
ProAgent: Building Proactive Cooperative AI with Large Language Models
08
在大型语言模型时代,
打造情感支持聊天机器人
将情感支持融入各种对话场景会带来深远的社会效益,如社交互动、心理健康咨询和客户服务。然而,数据可用性有限、缺乏公认的模型训练范例等一些尚未解决的难题阻碍了这一领域的实际应用。
该研究介绍了一种新方法,该方法综合了人类的洞察力和大型语言模型(LLM)的计算能力,进而策划了一个广泛的情感支持对话数据集——ExTES。该方法以精心设计的、跨越不同场景的对话集作为生成种子。通过利用 ChatGPT 的上下文学习潜力,我们递归生成了一个 ExTensible 情感支持对话数据集,命名为 ExTES。
对所生成模型的详尽评估证明了该模型在提供情感支持方面的能力,标志着情感支持机器人领域迈出了关键的一步。
论文:
Building Emotional Support Chatbots in the Era of LLMs
09
自我欺骗:
反向穿透大型语言模型的语义防火墙
以 ChatGPT 为代表的大型语言模型(LLMs)在为各种社会需求提供便利的同时,还降低了生成有害内容的成本。
尽管 LLMs 开发人员部署了语义层面的防御措施,但这些防御措施并非万无一失,一些攻击者通过制作“越狱”提示,使 LLMs 忘记内容防御规则,从而回答任何不当问题。迄今为止,业界和学术界都没有明确解释这些语义级攻击和防御背后的原理。
受通过反向隧道穿透传统防火墙的攻击的启发,该研究提出了一种“自我欺骗”攻击,通过诱导 LLMs 生成有利于越狱的提示来绕过语义防火墙。
他们在七个虚拟场景中用六种语言(英语、俄语、法语、西班牙语、中文和阿拉伯语)生成了共计 2520 个攻击,目标是三种最常见的违规类型:暴力、仇恨和色情。
结果显示,GPT-3.5-Turbo 和 GPT-4 两个模型的成功率分别为 86.2% 和 67%,失败率分别为 4.7% 和 2.2%,这凸显了拟议攻击方法的有效性。
论文:
Self-Deception: Reverse Penetrating the Semantic Firewall of Large Language Models
转自:“学术头条”微信公众号
如有侵权,请联系本站删除!