AI资讯

苹果最近开源的SlowFast-LLaVA-1.5多模态大模型,在长视频理解领域取得了不错的进展

苹果最近开源的;SlowFast-LLaVA-1.5(简称 SF-LLaVA-1.5)多模态大模型,在长视频理解领域确实取得了不错的进展。它通过一系列创新,在效率和性能之间找到了较好的平衡。下面这个表格汇总了它的核心特点和优势,帮你快速了解:特性维度核心特点优势与价值核心架构双流处理机制"慢流"用较低帧率(32帧)捕捉高清静态细节和场景信息;"快流"用较高帧率(9

游戏行业开发行业96%开发者使用AI工具‌

游戏行业AI工具应用现状呈现爆发式增长态势,多项权威调查显示行业渗透率已突破关键节点:‌核心数据表现‌行业渗透率:Unity 2025年报告显示96%开发者使用AI工具‌,谷歌云调查则显示87%的开发者应用AI技术‌,两者差异可能源于样本范围和调查时间不同工具类型偏好:44%开发者使用AI代理处理文本、语音、代码等多模态内容‌,生成式AI工具使用率达52%‌成本效益预期:94%开发者认为AI将显著

商汤科技推出的AI视频创作工具Seko,上线仅一个月就吸引了超过10万创作者使用

商汤科技推出的AI视频创作工具Seko,上线仅一个月就吸引了超过10万创作者使用,标志着AI视频创作进入了更智能、便捷的"一站式"新阶段。下面这个表格整理了商汤Seko的核心信息,帮你快速了解它。方面具体说明产品定位创编一体的AI短片创作智能体(Agent),而非单纯的视频生成器核心创新"创编一体"模式,重构视频生产工作流技术整合集成商汤日日新、即梦4.0、可灵2.1等主流多模态生成模型关键特性剧

AI系统新型漏洞:图像重采样攻击解析

AI系统新型漏洞:图像重采样攻击解析1. ‌漏洞原理与技术细节‌Trail of Bits研究人员发现,攻击者可通过‌图像重采样过程‌向AI系统注入恶意指令。具体流程如下:‌隐藏指令‌:在高分辨率图片中嵌入肉眼不可见的恶意指令(如特定色块组合)‌;‌触发漏洞‌:当AI系统自动降采样(如双三次插值算法处理)时,隐藏内容会转变为可读文本‌;‌数据窃取‌:大语言模型误将生成的文本视为用户输入并执行,导致

阿里达摩院世界机器人大会开源多项成果,推动具身智能发展

阿里巴巴达摩院在2025年世界机器人大会上宣布开源具身智能“三大件”,其中包括机器人上下文协议RynnRCP、视觉-语言-动作模型RynnVLA-001-7B和世界理解模型RynnEC。这一举措旨在推动具身智能技术的标准化发展,降低开发门槛,加速机器人在工业、家庭等场景的落地应用。1. RynnRCP(机器人上下文协议)RynnRCP是达摩院首次提出的机器人服务框架,借鉴了模型上下文协议(MCP)

百度智能云推出首批AI数字员工,引领行业新变革

AI数字员工,覆盖了多个核心业务职能,包括营销经理、还款助理、汽车销售、促销专员、产品经理、课程顾问以及招聘专员等。这意味着在众多关键业务环节中,AI数字员工都将发挥重要作用,有望重塑企业的运营模式和效率。

文心快码新推出的Zulu-CLI终端编码能力以及其他新功能

文心快码(Baidu Comate)近期确实推出了一系列新功能,特别是Zulu-CLI终端编码能力的加入,让开发者可以直接在命令行中使用AI辅助编程,进一步丰富了其AI编程助手生态。下面表格汇总了这些核心新功能:功能类别核心价值备注/注意事项Zulu-CLI终端内自然语言驱动编码,无缝融入现有工作流,提升效率需确保环境满足要求 (Node.js >= 22, ripgrep >= 12