AI资讯 - AI墨盒

夸克发布的健康大模型技术报告，详细揭示了其AI“主任医师”背后的技术细节

夸克发布的健康大模型技术报告，详细揭示了其AI“主任医师”背后的技术细节。这不仅是技术能力的展示，更体现了AI在医疗健康领域深度工程化应用的探索。下面我将为你梳理其核心要点。一、核心成就与定位国内首个通过12门核心学科主任医师笔试评测的AI模型：夸克健康大模型（QuarkMed）在2025年7月成功通过了涵盖全科医学等12门核心学科的主任医师笔试评测。这标志着其医学专业能力达到了一个全新的水准。“

AI资讯 2025年08月25日 0 点赞 0 评论 2724 浏览

苹果最近开源的SlowFast-LLaVA-1.5多模态大模型，在长视频理解领域取得了不错的进展

苹果最近开源的;SlowFast-LLaVA-1.5（简称 SF-LLaVA-1.5）多模态大模型，在长视频理解领域确实取得了不错的进展。它通过一系列创新，在效率和性能之间找到了较好的平衡。下面这个表格汇总了它的核心特点和优势，帮你快速了解：特性维度核心特点优势与价值核心架构双流处理机制"慢流"用较低帧率（32帧）捕捉高清静态细节和场景信息；"快流"用较高帧率（9

AI资讯 2025年08月25日 0 点赞 0 评论 1481 浏览

阿里最新开源的Vivid-VR模型通过概念蒸馏技术实现了文本到视频大模型（T2V）在视频修复任务中的突破性应用

阿里巴巴最新开源的Vivid-VR模型通过概念蒸馏技术实现了文本到视频大模型（T2V）在视频修复任务中的突破性应用，其核心创新在于解决了传统微调方法导致的分布漂移问题。该模型基于DiT架构，通过将预训练大模型对高质量视频的理解蒸馏到修复任务中，既提升了画质修复能力，又保留了生成高质量视频的核心能力。技术亮点‌概念蒸馏策略‌通过蒸馏T2V模型固有的高质量视频生成能力，避免微调过程中的性能衰减。这种策

AI资讯 2025年08月26日 0 点赞 0 评论 2083 浏览

微软开源的 VibeVoice-1.5B 模型在语音合成领域带来了一些值得关注的突破

核心突破：长时语音合成与多说话人支持VibeVoice-1.5B 的核心突破在于其长时语音合成能力和多说话人支持。超长语音合成：模型能一次性连续合成长达90分钟的超逼真语音。这相比此前多数模型只能合成60分钟以内语音，且30分钟后常出现音色漂移、语义断裂等问题，是一个显著提升。多说话人支持：最多可支持4名发言人进行语音合成，而此前许多开源模型最多仅支持2人。这意味着它能生成更接近自然对话的语音，为

AI资讯 2025年08月26日 0 点赞 0 评论 2191 浏览

"3D Model Generator" 的 3D 模型生成工具

字节跳动旗下的豆包团队正在内部测试一款名为"3D Model Generator"的 3D 模型生成工具，旨在降低 3D 创作的门槛。目前关于该工具的确切技术细节和发布时间官方尚未完全公开，但我们可以从测试页面和字节跳动相关技术积累中窥见一些特点。下面是这款工具主要功能的梳理：功能特点说明基于图像生成用户上传本地图片，工具可快速生成相应的 3D 模型。基于图像+模型生成结合

AI资讯 2025年08月26日 0 点赞 0 评论 1552 浏览

英伟达（NVIDIA）Jetson AGX Thor 开发者套件和产品级模组已正式上市

英伟达（NVIDIA）Jetson AGX Thor开发者套件和产品级模组已正式上市。这款被业界称为机器人“最强大脑”的计算平台，旨在为机器人提供强大的算力支持，有望显著推动物理AI和通用机器人的发展。下面是一个核心规格和与前代产品（Jetson AGX Orin）的对比，帮助你快速了解它的性能飞跃：特性维度Jetson AGX Thor提升幅度AI算力高达2070 TFL

AI资讯 2025年08月26日 0 点赞 0 评论 1355 浏览

AI技术进步“放缓”对市场的影响分析

AI技术进步“放缓”对市场的影响分析1. ‌AI技术发展的现状与放缓迹象‌2025年，AI技术在医疗、教育、金融、交通等领域已实现显著突破，多模态融合、实时交互和个性化定制成为主流趋势。然而，大型语言模型的迭代速度出现明显放缓迹象：‌技术瓶颈‌：Meta的Llama 4 Behemoth和OpenAI的GPT-5因性能提升困难而延期发布，且表现未达预期。‌发展模式转变‌：从指数级增长转向渐进式改进

AI资讯 2025年08月26日 0 点赞 0 评论 1259 浏览

AI系统新型漏洞：图像重采样攻击解析

AI系统新型漏洞：图像重采样攻击解析1. ‌漏洞原理与技术细节‌Trail of Bits研究人员发现，攻击者可通过‌图像重采样过程‌向AI系统注入恶意指令。具体流程如下：‌隐藏指令‌：在高分辨率图片中嵌入肉眼不可见的恶意指令（如特定色块组合）‌；‌触发漏洞‌：当AI系统自动降采样（如双三次插值算法处理）时，隐藏内容会转变为可读文本‌；‌数据窃取‌：大语言模型误将生成的文本视为用户输入并执行，导致

AI资讯 2025年08月26日 0 点赞 0 评论 1445 浏览

豆包正式上线未成年人保护模式

2025 年 8 月 26 日，豆包正式上线未成年人保护模式。家长输入密码开启该模式后，推荐视频、浏览第三方网页、和豆包以外的智能体对话、AI 创作功能将被默认关闭，而翻译、深入研究等功能仍能正常使用。此外，豆包小程序对于未满 14 周岁的用户会自动启用青少年模式，每日 22：00-06：00 关闭社交功能，单次使用超 45 分钟会触发提醒，消费行为也需监护人二次确认。

AI资讯 2025年08月26日 0 点赞 0 评论 1568 浏览

国产大模型发展迅猛，在技术实力和应用落地方面都取得了显著成就

智能体的发展则为 AI 新时代带来了新的变革和机遇。以下是相关情况的介绍：国产大模型的崛起态势性能提升显著：国内大模型在技术上不断取得突破，性能日益接近甚至超越国际先进水平。例如，字节跳动的 Doubao - Seed - 1.6 - thinking - 250715 在全球智能体任务测评中独占鳌头，位居全球第一。MiniMax 抛出全球首个开源大规模混合架构推理模型 MiniMax - M1，

AI资讯 2025年08月26日 0 点赞 0 评论 1378 浏览

AI资讯

首页

AI资讯

列表

默认

浏览次数

发布时间