视频

TrajectoryCrafter

TrajectoryCrafter是一种基于双流条件视频扩散模型的单目视频相机轨迹重定向工具,支持用户自定义相机运动路径并生成高质量、4D一致的视频内容。其核心技术包括解耦视图变换与内容生成、动态点云渲染以及混合数据集训练策略,具备强大的场景泛化能力。适用于沉浸式娱乐、视频创作、智能会议、自动驾驶及教育等多个领域。

AsrTools

AsrTools是一款无需复杂配置的智能语音转文字工具,支持多种音频格式的转换,生成SRT和TXT字幕文件,适用于视频字幕、会议记录、音频转写等多个场景。它具有友好的用户界面、高效的多线程处理能力以及详细的技术文档,旨在为用户提供便捷、准确的语音转文字解决方案。

万相2.1

通义万相2.1是一款基于自研VAE和DiT架构的AI视频生成工具,支持高精度视频编解码与中文文字生成,具备复杂动作展现、物理规律还原、中英文特效生成及艺术风格转换等功能。同时支持图像生成,适用于影视制作、广告视频、教学辅助、文化创作等多个领域,提供高效的创作体验与高质量输出。

Walles.AI

Walles.AI是一款多功能AI阅读工具,涵盖网页阅读、PDF解析、视频摘要生成及智能聊天对话等功能。它通过GPT-4和GPT-3.5技术支持,可快速提取关键信息并生成摘要,适用于学术研究、职场效率提升、语言学习及教育辅导等多个领域。

MarsAi

MarsX是一个改变软件开发游戏的平台,结合了AI、NoCode和代码,以及微应用。

米壳AI

企业必备的AI剪辑工具,提供翻译和视频解说。无惧出海,米壳AI助力本地化视频营销。

HumanOmni

HumanOmni 是一款面向人类中心场景的多模态大模型,融合视觉与听觉信息,具备情感识别、面部描述、语音理解等功能。基于大量视频与指令数据训练,采用动态权重调整机制,支持多模态交互与场景理解。适用于影视分析、教育、广告及内容创作等领域,具备良好的可扩展性和灵活性。

Silimini

Silimini是一款利用人工智能技术的动态表情生成工具,能够将静态照片转换为生动的动画表情。用户可通过选择模板并上传照片,一键生成个性化动态表情,支持高清视频保存与跨平台分享。其丰富的模板和简洁的操作流程使其广泛适用于社交媒体互动、节日祝福、个人娱乐及商业营销等多个领域。

Metaview

Metaview是一款利用人工智能技术的面试摘要工具,可自动记录和整理面试内容,生成结构化摘要,帮助招聘团队高效处理候选人信息。其核心功能包括关键信息提取、模板定制、数据安全保护以及与主流招聘系统的无缝集成,广泛应用于大规模招聘、远程面试和技术岗位筛选等场景。