工具

简单听记

百度网盘推出的一款AI语音转文字工具,简单听记能够帮你将音频内容转化为文字,还能进一步把这些文字提炼总结,帮你节省很多时间。

Lumina

Lumina-Image 2.0 是一款开源图像生成模型,基于扩散模型与 Transformer 架构,具有 26 亿参数。它能根据文本描述生成高质量、多风格的图像,支持中英文提示词,并具备强大的复杂提示理解能力。模型支持多种推理求解器,适用于艺术创作、摄影风格图像生成及逻辑推理场景,兼具高效性和灵活性。

NotaGen

NotaGen 是由多所高校联合研发的音乐生成模型,基于预训练、微调和强化学习技术,可生成高质量古典乐谱。支持通过“时期-作曲家-乐器”等条件控制音乐风格,具备高度音乐性与可控性。采用 CLaMP-DPO 方法优化生成质量,无需人工标注。适用于音乐创作、教育、影视配乐等多种场景,提供多种模型规模选择,满足不同需求。

投资策略模拟器

一种帮助投资者通过模拟环境来测试和优化他们的投资策略的工具,投资策略模拟器利用历史数据、市场模型和高级计算技术,如神经网络、大数据分析和云计算,来模拟股票、期货、外汇等市场的行为。

YouCam AI Pro

一款多功能人工智能艺术生成器,允许用户从文本和图像创建高质量的数字艺术和头像。 YouCam AI Pro 专注于创造力和易用性,适合艺术家、设计师和任何有兴趣探索人工智能生成视觉效果潜力的人。

OneStory.Art

一款创新的AI故事小说网文生成助手,OneStory.Art通过AI快速生成连续性、一致性的角色和故事网文,提供影视分镜、网文图片、游戏漫画以及更多内容创作。

FlexiAct

FlexiAct是由清华大学与腾讯ARC实验室联合研发的动作迁移模型,可在空间结构差异较大的场景下实现精准动作迁移,并保持目标主体的外观一致性。其核心模块包括轻量级RefAdapter和频率感知动作提取(FAE),有效提升跨主体动作迁移的灵活性与准确性。该模型适用于影视、游戏、广告等多个领域,具有良好的应用前景。

Story Flicks

一款开源的基于AI大模型的故事短视频生成工具。用户输入故事主题,就能够迅速生成包含AI生成图像、故事内容以及音频的视频。

Quick Mock

Quick Mock 是一款由 MirWork AI 开发的 AI 驱动型面试准备工具,能够将职位描述转化为定制化模拟面试体验。用户可通过 Chrome 扩展程序与 AI 面试官进行实时语音对话,并获得详细的反馈和评分。该工具支持与 LinkedIn 等平台集成,简化了面试练习流程,适用于求职者、企业培训及教学辅助等多种场景,有效提升沟通能力和面试表现。

TokenVerse

TokenVerse 是一种基于扩散模型的多概念图像生成工具,支持从单图或多图中解耦并组合视觉元素,如物体、材质、姿势等。通过优化调制空间,实现对复杂概念的局部控制,无需微调模型即可生成个性化图像,适用于创意设计、艺术创作和内容生成等多种场景。