AI资讯

苹果最近开源的SlowFast-LLaVA-1.5多模态大模型,在长视频理解领域取得了不错的进展

苹果最近开源的;SlowFast-LLaVA-1.5(简称 SF-LLaVA-1.5)多模态大模型,在长视频理解领域确实取得了不错的进展。它通过一系列创新,在效率和性能之间找到了较好的平衡。下面这个表格汇总了它的核心特点和优势,帮你快速了解:特性维度核心特点优势与价值核心架构双流处理机制"慢流"用较低帧率(32帧)捕捉高清静态细节和场景信息;"快流"用较高帧率(9

苹果可能选择与谷歌合作,通过 Gemini 大模型来提升 Siri 的 AI 能力

苹果可能选择与谷歌合作,通过 Gemini 大模型来提升 Siri 的 AI 能力,这确实是目前科技领域的一个热门话题。目前看来,双方仍处于早期探索阶段,苹果也在同步测试自研模型和其他外部模型(如 OpenAI 和 Anthropic),最终方案尚未确定。下面是一个主要信息的梳理:方面详细信息合作状态苹果与谷歌已进行初步洽谈,讨论使用 Gemini 作为新 Siri 的基础。尚未达成正式商业协议。

‌AI医疗助手赛道彻底爆发:市场格局、应用场景与未来挑战

近年来,AI医疗助手赛道迎来爆发式增长,从智能问诊到影像识别,从药物研发到个性化治疗,AI技术正深度重塑医疗行业。这一领域的快速发展既得益于技术进步,也源于全球医疗资源短缺的现实需求。‌一、AI医疗助手为何突然爆发?‌‌1. 技术成熟:大模型+医疗数据的突破‌‌自然语言处理(NLP)进步‌:GPT-4、Med-PaLM等大模型能更精准理解医学问题,提供专业建议。‌计算机视觉(CV)升级‌:AI影像

文心快码新推出的Zulu-CLI终端编码能力以及其他新功能

文心快码(Baidu Comate)近期确实推出了一系列新功能,特别是Zulu-CLI终端编码能力的加入,让开发者可以直接在命令行中使用AI辅助编程,进一步丰富了其AI编程助手生态。下面表格汇总了这些核心新功能:功能类别核心价值备注/注意事项Zulu-CLI终端内自然语言驱动编码,无缝融入现有工作流,提升效率需确保环境满足要求 (Node.js >= 22, ripgrep >= 12

百万网友沉迷AI小游戏,简笔画能变成活鱼

玩法简单易上手Draw A Fish的玩法非常简单直接:你只需要访问网站https://drawafish.com/,就能看到一个简单的绘图工具。选择颜色和笔刷粗细后,在画布上画一条面朝右侧的小鱼即可。AI会实时判断你的作品是否像鱼,并通过画布背景颜色的变化给予即时反馈。当相似度达到60%以上时,点击 "make it swim" 按钮,再给小鱼起个名字,你就能把它“放生”到一个共享的

DeepSeek-V3.1 的发布,标志着深⼊智能 Agent 时代的⼀次重要迈进

是的,DeepSeek-V3.1 的发布,标志着深⼊智能 Agent 时代的⼀次重要迈进。这次升级不仅在模型能⼒、推理效率和多任务处理方面有显著提升,更在架构设计上为未来 AI 应用场景提供了更强的支持。接下来,我为你梳理一下 DeepSeek-V3.1 的主要升级点、技术特点以及它如何推动智能 Agent 的发展。一、混合推理架构:兼顾效率与深度DeepSeek-V3.1

AI系统新型漏洞:图像重采样攻击解析

AI系统新型漏洞:图像重采样攻击解析1. ‌漏洞原理与技术细节‌Trail of Bits研究人员发现,攻击者可通过‌图像重采样过程‌向AI系统注入恶意指令。具体流程如下:‌隐藏指令‌:在高分辨率图片中嵌入肉眼不可见的恶意指令(如特定色块组合)‌;‌触发漏洞‌:当AI系统自动降采样(如双三次插值算法处理)时,隐藏内容会转变为可读文本‌;‌数据窃取‌:大语言模型误将生成的文本视为用户输入并执行,导致

"3D Model Generator" 的 3D 模型生成工具

字节跳动旗下的豆包团队正在内部测试一款名为"3D Model Generator"的 3D 模型生成工具,旨在降低 3D 创作的门槛。目前关于该工具的确切技术细节和发布时间官方尚未完全公开,但我们可以从测试页面和字节跳动相关技术积累中窥见一些特点。下面是这款工具主要功能的梳理:功能特点说明基于图像生成用户上传本地图片,工具可快速生成相应的 3D 模型。基于图像+模型生成结合

特斯拉车机系统接入豆包和DeepSeek可通过语音指令直接唤醒

特斯拉官网更新的《特斯拉车机语音助手使用条款》显示,特斯拉车机语音助手将接入火山引擎提供的 Doubao 大模型(云雀大模型)和 DeepSeek Chat。车主可以通过物理按键、“嘿,Tesla” 或自定义唤醒词激活车机语音助手,进而与车辆进行语音交互。特斯拉已在中国市场为其车辆接入了豆包(Doubao)和DeepSeek AI模型,并支持通过语音指令直接唤醒。以下是主要信息:1. 双AI模型分

Meta人工智能业务重组全景分析

一、重组背景与战略动因2025年8月20日,Meta正式宣布将"超级智能实验室"拆分为四大职能小组:基础研究组(保留FAIR实验室)、超级智能技术组、产品商业化组及基础设施组。此次重组是扎克伯格继2023年"效率年"裁员2.1万人后,针对AI业务的第三次重大结构调整。核心动因包括:竞争压力激增:面对OpenAI、Anthropic等对手的快速迭代,Meta需缩短从研究到产品的转化周期资源优化需求: