腾讯研究院AI速递 20240709
生成式AI
一、 单卡A100百万token推理,速度快10倍,微软推理加速新方法
1. 微软研究加速单卡A100机器处理超过1M token的推理速度提升10倍;
2. MInference采用动态稀疏注意力,无需修改预训练设置即可提高长上下文LLM的预填充阶段效率;
3. 通过实际应用测试证明,MInference能在保持准确性的同时,显著降低处理延迟。
021yin.com/s/aeGqsPIKnnNZEW-i02TcMw
二、 第3种记忆:比参数存储和RAG都便宜,2.4B模型越级打13B
1. Memory3引入了第三种记忆形式,成本低于传统参数存储和RAG,提高了大模型处理专业领域任务的速度和准确性;
2. 该技术通过将常用知识转化为显式记忆,优化了知识的存储和提取效率,有效解放模型参数;
3. Memory3通过压缩和优化技术,将显式记忆的存储需求大幅降低,同时减少了在推理过程中的内存占用和IO开销。
021yin.com/s/w2eaoHjOK9mgGb7FAqpH8w
三、 腾讯大模型工具链全面升级,专注生产力,加速模型场景落地!
1. 腾讯推动大模型工具链全面升级,涵盖基础设施、开发平台到多元智能应用,加速企业场景落地;
2. 混元大模型采用MoE架构,参数量达万亿级,支持超高容量token处理,优化智能生产力应用;
3. 引入PaaS工具如大模型知识引擎和创作引擎,降低使用门槛,支持快速开发和多场景应用。
021yin.com/s/gggJZ9QC5g9kl5iXkaULMg
四、 哈佛DeepMind在世界模拟器驯养「赛博老鼠」,开辟虚拟神经科学
1. 哈佛大学与DeepMind合作开发了AI驱动的虚拟大鼠,模拟真实啮齿动物的动作和行为;
2. 创立虚拟神经科学领域,通过高分辨率的实际数据训练的人工神经网络控制虚拟大鼠,预测真实大鼠的神经活动;
3. 该研究将帮助理解大脑产生复杂行为的机制,提供了一个透明、便捷的平台,也可用于改进机器人控制系统。
021yin.com/s/Tk9U4pS7WNqRX8gZklkREQ
五、 几分钟生成四维内容,还能控制运动效果:北大、密歇根提出DG4D
1. DG4D技术结合空间变换显式建模和静态3D Gaussian Splatting,实现高效四维内容生成;
2. 通过图像到4D GS和视频到视频纹理细化两大模块,大幅优化生成速度并提升运动效果的控制;
3. 将四维内容生成时间从数小时减少到几分钟,支持在三维引擎中真实渲染,增强视觉效果和应用潜力。
021yin.com/s/6RruiXtoatqjmMoxW8M3gw
六、 将GPT接入《星际穿越》中的 TARS 机器人,开源教程和代码
1. 使用树莓派3B+和Adafruit PCA-9685伺服驱动器构建高仿真度的TARS机器人,具备基本的行走和互动功能;
2. 机器人通过双NiMH电池组供电,支持通过蓝牙遥控器远程控制,显示信息由5英寸HDMI显示器提供;
3. 开发过程中优化步态控制算法和电源管理,未来计划引入机器学习技术和增加更多传感器以提高交互能力。
021yin.com/s/EM3IgYfg1MmOStec7uVQXQ
七、 阿里发布开源语音交互模型 FunAudioLLM ,展现各种语音黑科技
1. FunAudioLLM包括SenseVoice和CosyVoice两个模块,前者擅长多语言语音识别和情绪分析,后者专注于自然语音生成;
2. SenseVoice支持超过50种语言,具备音频事件检测功能;CosyVoice可以进行多语言语音生成和音色情感控制;
3. 该模型框架已开源,可应用于语音翻译、情感语音聊天、交互式播客和有声读物,推动自然语音交互技术的发展。
021yin.com/s/0lsYq31Hh_l0sIuQ52Qt7A
前沿科技
八、 优于AlphaFold,全原子采样,一种预测肽结构的AI方法登Nature
1. PepFlow由多伦多大学开发,是一种全原子采样的AI模型,能高效地从肽的允许构象空间中进行采样;
2. 模型优化了全原子建模的高成本问题,通过超网络预测序列特定的网络参数,显著减少了传统方法的运行时间;
3. PepFlow的能力超越了AlphaFold,能够生成肽的多种构象,为肽结构的预测和药物开发提供强大支持。
021yin.com/s/aAZL8lercjTlx7OLIMvgUA
报告观点
九、 2024WAIC闭幕,我们整理了场内场外业界大佬AI辩论的“修罗场”
1. 开源与闭源辩论:开源派认为共享促进技术创新和防止垄断,闭源派看重商业利益和性能优化,各有支持者论证各自立场的合理性和优势;
2. 实际应用重要性:大佬们较一致认为,应将关注点从模型本身转移到具体应用上,如何通过大模型开发出满足市场需求的AI应用更为关键;
3. 创新源于开放:尽管闭源模型在某些领域表现优越,但开源模型由于其广泛的贡献者和验证,并有赶上甚至超过闭源模型的潜力。
021yin.com/s/t3yYaI-5ckDFqLuFJVfPdA
十、 红杉美国合伙人:AI 不会取代软件,而是带来新的商业模式和机会
1. AI技术正处于转折点,将创造新商业模式和机会,特别是在服务行业,如法律和会计等领域,这些行业的文本处理工作流程非常适合AI技术应用;
2. 稳定的基础AI模型对整个AI生态系统发展至关重要,这种稳定性支持企业更有效地预测和构建应用程序,推动工程化优化和认知架构设计;
3. 尽管AI将带来新的服务模式,人际关系和实际执行任务将继续依赖人工,不会被AI完全取代。
021yin.com/s/pvc4fuRKFIi5g8ispYXCGw
👇订阅下方合集,获取每日推送