AI资讯

夸克发布的健康大模型技术报告,详细揭示了其AI“主任医师”背后的技术细节

夸克发布的健康大模型技术报告,详细揭示了其AI“主任医师”背后的技术细节。这不仅是技术能力的展示,更体现了AI在医疗健康领域深度工程化应用的探索。下面我将为你梳理其核心要点。一、核心成就与定位国内首个通过12门核心学科主任医师笔试评测的AI模型:夸克健康大模型(QuarkMed)在2025年7月成功通过了涵盖全科医学等12门核心学科的主任医师笔试评测。这标志着其医学专业能力达到了一个全新的水准。“

苹果最近开源的SlowFast-LLaVA-1.5多模态大模型,在长视频理解领域取得了不错的进展

苹果最近开源的;SlowFast-LLaVA-1.5(简称 SF-LLaVA-1.5)多模态大模型,在长视频理解领域确实取得了不错的进展。它通过一系列创新,在效率和性能之间找到了较好的平衡。下面这个表格汇总了它的核心特点和优势,帮你快速了解:特性维度核心特点优势与价值核心架构双流处理机制"慢流"用较低帧率(32帧)捕捉高清静态细节和场景信息;"快流"用较高帧率(9

阿里最新开源的Vivid-VR模型通过概念蒸馏技术实现了文本到视频大模型(T2V)在视频修复任务中的突破性应用

阿里巴巴最新开源的Vivid-VR模型通过概念蒸馏技术实现了文本到视频大模型(T2V)在视频修复任务中的突破性应用,其核心创新在于解决了传统微调方法导致的分布漂移问题。该模型基于DiT架构,通过将预训练大模型对高质量视频的理解蒸馏到修复任务中,既提升了画质修复能力,又保留了生成高质量视频的核心能力。技术亮点‌概念蒸馏策略‌通过蒸馏T2V模型固有的高质量视频生成能力,避免微调过程中的性能衰减。这种策

微软开源的 VibeVoice-1.5B 模型在语音合成领域带来了一些值得关注的突破

核心突破:长时语音合成与多说话人支持VibeVoice-1.5B 的核心突破在于其长时语音合成能力和多说话人支持。超长语音合成:模型能一次性连续合成长达90分钟的超逼真语音。这相比此前多数模型只能合成60分钟以内语音,且30分钟后常出现音色漂移、语义断裂等问题,是一个显著提升。多说话人支持:最多可支持4名发言人进行语音合成,而此前许多开源模型最多仅支持2人。这意味着它能生成更接近自然对话的语音,为

"3D Model Generator" 的 3D 模型生成工具

字节跳动旗下的豆包团队正在内部测试一款名为"3D Model Generator"的 3D 模型生成工具,旨在降低 3D 创作的门槛。目前关于该工具的确切技术细节和发布时间官方尚未完全公开,但我们可以从测试页面和字节跳动相关技术积累中窥见一些特点。下面是这款工具主要功能的梳理:功能特点说明基于图像生成用户上传本地图片,工具可快速生成相应的 3D 模型。基于图像+模型生成结合

英伟达(NVIDIA)Jetson AGX Thor 开发者套件和产品级模组已正式上市

英伟达(NVIDIA)Jetson AGX Thor开发者套件和产品级模组已正式上市。这款被业界称为机器人“最强大脑”的计算平台,旨在为机器人提供强大的算力支持,有望显著推动物理AI和通用机器人的发展。下面是一个核心规格和与前代产品(Jetson AGX Orin)的对比,帮助你快速了解它的性能飞跃:特性维度Jetson AGX Thor提升幅度AI算力高达2070 TFL

AI技术进步“放缓”对市场的影响分析

AI技术进步“放缓”对市场的影响分析1. ‌AI技术发展的现状与放缓迹象‌2025年,AI技术在医疗、教育、金融、交通等领域已实现显著突破,多模态融合、实时交互和个性化定制成为主流趋势。然而,大型语言模型的迭代速度出现明显放缓迹象:‌技术瓶颈‌:Meta的Llama 4 Behemoth和OpenAI的GPT-5因性能提升困难而延期发布,且表现未达预期。‌发展模式转变‌:从指数级增长转向渐进式改进

AI系统新型漏洞:图像重采样攻击解析

AI系统新型漏洞:图像重采样攻击解析1. ‌漏洞原理与技术细节‌Trail of Bits研究人员发现,攻击者可通过‌图像重采样过程‌向AI系统注入恶意指令。具体流程如下:‌隐藏指令‌:在高分辨率图片中嵌入肉眼不可见的恶意指令(如特定色块组合)‌;‌触发漏洞‌:当AI系统自动降采样(如双三次插值算法处理)时,隐藏内容会转变为可读文本‌;‌数据窃取‌:大语言模型误将生成的文本视为用户输入并执行,导致

豆包正式上线未成年人保护模式

2025 年 8 月 26 日,豆包正式上线未成年人保护模式。家长输入密码开启该模式后,推荐视频、浏览第三方网页、和豆包以外的智能体对话、AI 创作功能将被默认关闭,而翻译、深入研究等功能仍能正常使用。此外,豆包小程序对于未满 14 周岁的用户会自动启用青少年模式,每日 22:00-06:00 关闭社交功能,单次使用超 45 分钟会触发提醒,消费行为也需监护人二次确认。

国产大模型发展迅猛,在技术实力和应用落地方面都取得了显著成就

智能体的发展则为 AI 新时代带来了新的变革和机遇。以下是相关情况的介绍:国产大模型的崛起态势性能提升显著:国内大模型在技术上不断取得突破,性能日益接近甚至超越国际先进水平。例如,字节跳动的 Doubao - Seed - 1.6 - thinking - 250715 在全球智能体任务测评中独占鳌头,位居全球第一。MiniMax 抛出全球首个开源大规模混合架构推理模型 MiniMax - M1,