工具

Pixel Reasoner

Pixel Reasoner是由多所高校联合开发的视觉语言模型,通过像素空间推理增强对视觉信息的理解和分析能力。它支持直接对图像和视频进行操作,如放大区域或选择帧,以捕捉细节。采用两阶段训练方法,结合指令调优和好奇心驱动的强化学习,提升视觉推理性能。在多个基准测试中表现优异,适用于视觉问答、视频理解等任务,广泛应用于科研、教育、工业质检和内容创作等领域。

Gemma 3

Gemma 3 是谷歌推出的开源人工智能模型,支持多语言、多模态处理,具备文本、图像及短视频分析能力。提供多种模型尺寸,适配不同硬件环境,优化了单 GPU/TPU 性能,推理速度提升显著。内置图像安全分类器,增强内容安全性。支持多种开发工具和部署方式,适用于人脸识别、物体检测、智能助手、文本分析等场景。

HandTalk

一款利用人工智能技术,自动将文本和音频翻译成手语的应用程序。它支持美国手语(ASL)和巴西手语(Libras),为全球约4.66亿聋人和重听人士提供了一个融入社会的新途径。

Augment Agent

Augment Agent 是一款 AI 编程助手,支持 VS Code 和 JetBrains,具备强大上下文处理能力(最高 20 万 tokens),可自动学习用户编码风格并保持一致性。支持多模态输入、代码检查点、终端命令及跨平台协作,适用于复杂代码库开发和日常编程任务,性能在基准测试中表现优异。

千绘AI

一款AI漫画创作平台,用户可以通过千绘AI生成分镜,并将其转化为图片。千绘AI支持角色引用,确保角色在不同分镜中保持一致。

Auto Backend

Auto Backend 是一个您只需几句话即可为您的 Web 应用程序生成后端的网站开发工具。

Lingolette

Lingolette是一款利用AI技术打造的语言学习平台,专注于通过实时对话和个性化学习路径提升用户的外语口语与书面表达能力。平台支持多种语言(如英语、法语、德语等),并结合沉浸式场景、逐步指导和每日更新的内容激发学习动力。此外,它适合个人、教育机构、职场人士及企业团队使用,满足多样化的学习需求。

分秒帧

分秒帧一站式音视频生产协作平台,提供从在线审片批注、意见收集到成片交付,以及素材和版本管理、项目流程管控等全方位功能。

Brev AI

Brev AI 是一款基于 AI 的在线音乐生成工具,能够将文本描述转化为定制化的音乐作品。它支持多种音乐风格,涵盖旋律、和声及完整曲目生成,并具备强大的自定义功能。凭借其高质量音频输出和广泛适用性,Brev AI 可应用于视频、社交媒体、播客等领域,满足不同用户的创作需求。

Crawl4LLM

Crawl4LLM是由清华与CMU联合开发的智能爬虫系统,通过评估网页对大语言模型预训练的价值,提升数据获取效率。支持多种爬取模式,具备状态保存、数据可视化功能,并与DCLM框架兼容。采用多维度评分机制优化爬取策略,减少低价值内容抓取,降低对网站负担,适用于LLM预训练、数据集构建等场景。