多模态 - AI墨盒

腾讯新发布的 AudioGenie 是音频生成领域的一次重大突破

腾讯新发布的AudioGenie是音频生成领域的一次重大突破，其核心优势在于多模态输入支持、免训练架构和专业级音效生成能力，直接挑战了当前国际主流模型（如Claude、Gemini）在AI音频市场的地位。以下从技术原理、性能表现及行业影响三方面深度解析：一、技术突破：无训练框架与多模态融合多模态输入全能输出（视频/文本/图像→音频）AudioGenie 支持视频、文本、图像

AI资讯 2025年08月18日 0 点赞 0 评论 2144 浏览

DeepSeek-V3.1 的发布，标志着深⼊智能 Agent 时代的⼀次重要迈进

是的，DeepSeek-V3.1 的发布，标志着深⼊智能 Agent 时代的⼀次重要迈进。这次升级不仅在模型能⼒、推理效率和多任务处理方面有显著提升，更在架构设计上为未来 AI 应用场景提供了更强的支持。接下来，我为你梳理一下 DeepSeek-V3.1 的主要升级点、技术特点以及它如何推动智能 Agent 的发展。一、混合推理架构：兼顾效率与深度DeepSeek-V3.1

AI资讯 2025年08月25日 0 点赞 0 评论 1906 浏览

腾讯混元大模型：大语言模型、自然语言大模型

混元大模型主要有以下功能：一、知识问答广泛的知识覆盖可以回答历史、科学、技术、文化等各个领域的问题。例如，回答历史事件的发生时间、背景和影响，像“工业革命是如何开始的，对世界产生了哪些深远影响？”；解释科学概念，如“量子纠缠是什么原理”；介绍不同文化的习俗和传统，像“印度的排灯节有哪些独特的庆祝方式”等。深度知识解读对于一些复杂的知识体系，能够进行深入剖析。比如在医学领域，不仅能回答常见疾病的

AI应用 2025年08月28日 0 点赞 0 评论 1799 浏览

腾讯元宝入驻视频号评论区，确实让这个AI聊天搭子更加贴近用户的日常刷视频场景了。它旨在通过即时、自然的互动方式，提升用户在视频号内的信息获取效率和互动体验。下面是一个简要的功能概览表，帮你快速了解元宝在视频号评论区能做什么：功能类别主要能力内容理解与总结快速提炼视频核心观点实时问答针对视频内容进行提问，获取精准解答创意与趣味互动根据视频内容或用户上传的图片进行创作、写诗、提供情感回应实用建议与推荐

AI资讯 2025年08月30日 0 点赞 0 评论 1945 浏览