AI - 智狐AI导航

Aria

Aria是首个开源多模态原生混合专家（MoE）模型，支持文本、代码、图像和视频的综合处理，具有强大的多模态任务处理能力和长上下文窗口，可高效应对复杂长数据。模型开源且可扩展，适用于多模态AI领域的研究与应用。

AI项目与工具 2025年06月12日 48 点赞 0 评论 619 浏览

Speechnotes

Speechnotes是一款基于AI的语音转文字工具，提供高精度语音识别、实时语音输入、语音命令支持、自动大写处理等功能，支持多平台操作（Chrome扩展、Android、iOS、API等）。它强调隐私保护，录音不经过人工处理且自动删除，适合快速转录、会议记录、写作、医疗记录等多种应用场景，是提升工作效率的理想选择。

AI项目与工具 2025年06月12日 68 点赞 0 评论 619 浏览

WorldSense

WorldSense是由小红书与上海交通大学联合开发的多模态基准测试工具，用于评估大型语言模型在现实场景中对视频、音频和文本的综合理解能力。该平台包含1662个同步视频、3172个问答对，覆盖8大领域及26类认知任务，强调音频与视频信息的紧密耦合。所有数据经专家标注并多重验证，确保准确性。适用于自动驾驶、智能教育、监控、客服及内容创作等多个领域，推动AI模型在多模态场景下的性能提升。

AI项目与工具 2025年06月12日 61 点赞 0 评论 619 浏览

logopony

Logopony是一个AI驱动的在线Logo设计生成工具，它可以帮助用户快速生成专业的Logo设计。

图片处理 2025年06月05日 37 点赞 0 评论 619 浏览

Skyvern

Skyvern是一款基于开源的浏览器自动化工具，集成了大型语言模型和计算机视觉技术，用于实现网页内容解析、交互计划生成及执行。其主要功能涵盖CAPTCHA解决、双因素认证支持、代理网络配置、可解释AI操作以及数据提取等，适用于网站数据抓取、表单填写、网页测试等多种应用场景。

AI项目与工具 2025年06月12日 90 点赞 0 评论 619 浏览

DomoAi

DomoAi，一个用于从动漫中创建栩栩如生的肖像的免费AI工具，通过 DomoAI 将文本转换为令人惊叹的图像。释放你的创造力！加入 discord 免费访问 Domo.AI 工具，探索基于艺术、动漫、内容创作等的广泛社区！

Ai绘画生成 2025年06月05日 40 点赞 0 评论 619 浏览

SynCD

SynCD是由卡内基梅隆大学与Meta联合开发的高质量合成训练数据集，用于提升文本到图像模型的定制化能力。它通过生成同一对象在不同视角、光照和背景下的图像，结合共享注意力机制和3D资产引导，确保对象一致性。该数据集支持无调优模型训练，提升图像质量和身份保持能力，广泛应用于个性化内容生成、创意设计、虚拟场景构建等领域。

AI项目与工具 2025年06月12日 92 点赞 0 评论 619 浏览

AI Interview Copilot

AI Interview Copilot是一款专为求职者设计的AI辅助工具，通过实时语音转录和先进的语言模型（如GPT-4）来提升远程面试的表现。主要功能包括实时转录、问题解答、算法问题解决和图像识别等。该工具支持多语言，帮助求职者在技术或编程面试中快速生成答案和代码，从而更加自信地展示专业技能，提高面试成功率。

AI项目与工具 2025年06月12日 58 点赞 0 评论 619 浏览

CreatorKit

CreatorKit是一款基于AI技术的视觉内容创作工具，支持图片、视频及广告的智能生成与编辑。其核心功能包括AI图像生成、视频制作、品牌定制、多平台适配等，适用于电商、社交媒体及广告行业。用户可通过简单指令完成内容创作，提升效率并优化视觉呈现。提供多种订阅方案，满足不同规模企业的需求。

AI项目与工具 2025年06月12日 66 点赞 0 评论 619 浏览

SVG.IO

一个可以将文本提示转换为SVG图像（可缩放矢量图形）的AI在线生成工具

Ai绘画生成 2025年06月05日 27 点赞 0 评论 619 浏览

AI

首页

AI

列表

默认

浏览次数

发布日期