AI

VideoPoet

VideoPoet是一款基于大模型的AI视频生成工具,支持从文本、图像或视频输入中合成高质量的视频内容及匹配的音频。其核心优势在于多模态大模型设计,能够处理和转换不同类型的输入信号,无需特定数据集或扩散模型即可实现多种风格和动作的视频输出。主要功能包括文本到视频转换、图像到视频动画、视频风格化、视频编辑和扩展、视频到音频转换以及多模态学习等。技术原理涉及多模态输入处理、解码器架构、预训练与任务适应

文心大模型

文心大模型是一种知识增强的自然语言处理(NLP)模型,由百度开发。它在技术开放日上首次亮相,展示了其在AI领域的最新技术突破和产业应用实践。

OwchBuddy

OwchBuddy是一款集AI技术支持的个人伤害辅助工具,涵盖医疗、法律及心理健康领域。它提供24小时在线支持、个性化恢复方案、法律资源对接、律师联络服务、多语言翻译以及康复进程跟踪等功能,适用于交通事故、运动损伤、工伤、脑部创伤等多种场景下的恢复需求。

OLMo 2 32B

OLMo 2 32B 是由 Allen Institute for AI 推出的开源语言模型,拥有 320 亿参数,性能接近更大规模模型。它采用三阶段训练策略,结合预训练、中期训练和后训练,提升模型稳定性与任务适应性。模型支持多任务处理,涵盖自然语言处理、数学推理、编程辅助和内容创作等领域,并具备高效训练能力与低能耗优势。所有数据、代码和权重均开源,便于研究与开发。

TokenFD

TokenFD是由上海交通大学与美团联合开发的细粒度图文对齐基础模型,专为文档理解任务设计。通过图像与语言Token的统一特征空间对齐,支持Token级图文交互,提升了多模态任务性能。其基于自研的TokenIT数据集进行训练,涵盖2000万张图像和18亿高质量Token-Mask对,覆盖多种文本图像类型。TokenFD可用于文档处理、图像审查、文字检索及大模型知识增强等多个领域,具有广泛的适用性和

Lipsync

Lipsync-2 是 Sync Labs 推出的全球首个零样本嘴型同步模型,无需预训练即可快速生成符合说话者风格的嘴型动作。支持多语言、个性化表达和温度参数调节,具备高精度、高真实感和高效处理能力,广泛应用于视频翻译、动画制作、多语言教育及 AI 内容生成等领域。

CoreAgent

CoreAgent是网易智企推出的企业级智能体开发协作平台,支持问答、工作流、自主智能体等多种形态的智能体开发、测评和托管。平台采用RAG技术构建知识库,具备高性能检索和高召回效果,并通过沙箱运行机制确保安全隔离和资源可控。同时支持MCP协议调度第三方服务,检测内容合规性,与网易CodeWave无缝连接,助力企业快速落地智能应用。

逗哥配音

逗哥配音是一款基于AI技术的在线配音平台,专为短视频创作者设计。它提供多样化的语音风格选择、智能配音制作工具以及声音克隆功能,支持无损音质输出。用户可以利用该平台轻松生成个性化配音作品,广泛适用于广告宣传、教育培训、游戏开发等多个领域。