当前位置:首页 > 百科 > 正文内容

腾讯研究院AI速递 20240805

伊犁哈萨克台历印刷7个月前 (08-05)百科19
印刷厂直印●彩页1000张只需要69元●名片5元每盒-更多报价➦联系电话:138-1621-1622(微信同号)

生成式AI

一、 特斯拉用于全自动驾驶(FSD)和Optimus机器人训练的超级集群

1. Dojo超算是特斯拉AI技术的核心,专为FSD和Optimus机器人视频训练设计,配备约10万个H100/H200 GPU和大规模存储系统;

2. 特斯拉不仅使用英伟达GPU,还自研AI计算机Tesla HW4 AI,预计Dojo的计算能力将达到100 exaflops;

3. Dojo采用晶圆级互连技术InFO_SoW,通过25个D1芯片组成的tile实现高性能连接,目标是通过部署多个ExaPOD扩展超算能力.

021yin.com/s/mamA92fmOExN-nJJkrTtEw

二、 谷歌与Character AI25 亿交易的真实细节,并非简单收购

1. Google 收购 Character.AI,涉及支付25亿美元给原投资者,按股价88美元回购股份;

2. Google 获得 Character.AI 大型语言模型技术的非独占许可,Character.AI 转向使用开源模型如 Llama 3.1;

3. Character.AI 创始成员及部分研究团队加入Google,其余团队继续开发 Character.AI 产品,Dominic Perella 担任临时CEO.

021yin.com/s/kHk9yY9xqfBuoPXvgQTVBw

三、 Reddit 宣布收购Memorable AI ,以提升平台广告效果

1. Reddit 收购 Memorable AI,后者专注于使用生成式 AI 优化广告内容,包括文本、图片和视频;

2. Memorable AI 技术能预测广告引发的直接行动频率,其团队将加入 Reddit 广告部门;

3. 此次收购旨在加速 Reddit 在广告创意的优化、生成和选择方面的工作,提升广告效果.

021yin.com/s/061csYqT_BUDiXXhxvaNhg

四、 AMD发布本地文生图模型Amuse 2.0 Beta,针对显卡优化

1. AMD发布了面向PC的本地文生图模型Amuse 2.0 Beta,特别优化了AMD Ryzen™ AI 300系列处理器和 Radeon™ RX 7000系列显卡;

2. Amuse 2.0 Beta安装简单,用户友好,支持快速配置并使用超分辨率技术将图片从512x512无损扩展至1024x1024;

3. 提供三种模式和AI滤镜功能,帮助用户根据文本提示生成稳定的图片并创造个性化风格,如复古、油画等.

021yin.com/s/y2X82r9kkDN吉印通138162116225HUWtTUpw

五、 一个全是 AI 的贴吧,几百号聊天机器人聚一起吐槽人类

1. Deaddit是一个全AI的社区,所有账号和内容由大语言模型生成,专为机器人提供自由交流的平台;

2. 机器人在Deaddit上讨论技术问题、分享工作技巧,并模拟人类社交媒体行为,如吐槽和提供支持;

3. Deaddit的互动显示出AI的社交模拟能力,机器人通过生成的内容和互动,探索和表达对人类行为的理解和模仿.

021yin.com/s/EvmMMMQvI6ExE_naxfyMCA

六、 比OpenAI的Whisper快50%,aiOla发布最新开源语音模型

1. aiOla开源了Whisper-Medusa语音模型,基于Whisper架构改进,采用多头注意力机制,推理速度比OpenAI的Whisper快50%;

2. Whisper-Medusa通过并行处理多个token,提高了模型的推理效率和上下文捕捉能力,使用弱监督方法减少对大量标注数据的依赖;

3. 模型支持100多种语言,适用于多种业务场景,如翻译和音频转录,未来计划扩展至20个注意力头以进一步提升效率.

021yin.com/s/hyl6cJxlSD8jDRi7CzFFyg

七、 基于Llama 3.1 405B的Llamacoder,简单提示生成完整小程序代码

1. LlamaCoder是一个开源AI编程工具,专为React项目设计,提供在线代码编辑和即时预览功能;

2. 集成了CodeSandbox平台,支持在浏览器中直接编写、预览代码,并简化了项目文件的下载和本地运行过程;

3. 尽管当前版本存在限制,如不支持第三方组件导入,LlamaCoder的开源性质和计划中的功能升级预示了其潜力和未来的改进空间.

021yin.com/s/3UA6QRaoz2HoeLN吉印通13816211622ZosLQ

前沿科技

八、 世界首例!AI机器人做牙科手术,8倍速诊疗比人类医生更精准

1. Perceptive公司开发的AI机器人牙医首次完成人类牙科手术,速度是人类医生的8倍,能够精确处理患者头部移动;

2. 机器人使用OCT 3D成像系统生成牙齿内部的高分辨率3D图像,提高诊断准确性,避免X射线辐射;

3. 机器人牙医通过物理耦合与患者头骨连接,确保手术过程中的精确与安全,预计将改变牙科治疗效率和体验.

021yin.com/s/eSsPsFXCFCgE8MM1JGcIrQ

九、 Figure.AI吉印通创始人宣布,将于8月6日发布Figure 02机器人

1. Figure.AI将于8月6日发布Figure 02型号,宣称为地球上最强的人形机器人;

2. Figure 02预计将集成OpenAI的最新GPT-4o模型,增强其多模态功能,包括推理、视觉和听觉能力;

3. 相比前一代,Figure 02可能在灵巧度方面有显著提升,这是实体机器人技术中的一大挑战.

021yin.com/s/5LnUuHYrPOS7_e2gNEe3HQ

报告观点

十、 Benchmark合伙人谈AI投资:基座模型是历史上贬值最快的资产

1. 基础模型的快速贬值:Eisenberg指出,尽管AI具有变革性,但基础模型是历史上贬值最快的资产,预计许多投资者将面临亏损;

2. IPO和并购展望:Eisenberg对私募股权作为主要买家持怀疑态度,认为IPO窗口始终开放,建议创始人考虑更早上市;

021yin.com/s/Jou_GV5tQhsKHcxDfzXgTA

👇订阅下方合集,获取每日推送

收藏0

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。