工具

豆包1.5·UI

豆包1.5·UI-TARS是字节跳动推出的一款面向图形用户界面(GUI)的智能代理模型,具备视觉理解、逻辑推理和操作执行能力。它无需预定义规则,即可实现端到端的GUI任务自动化,适用于办公、测试、客服及机器人交互等多个场景。模型基于多模态融合与端到端学习技术,支持高效的界面交互与精准的视觉定位。

Bohrium玻尔

深势科技打造的科研云平台,目的为微尺度科学研究与工业设计提供高效的团队协作工具。支持科研人员在数据处理、深度学习建模、分子设计等领域的研究与应用。

KuaiMod

KuaiMod 是快手开发的多模态大模型内容审核系统,能高效识别和过滤有害及低质量视频。它结合视觉语言模型(VLM)和链式推理(CoT)技术,支持动态策略更新和强化学习,提升审核准确性。系统在离线测试中准确率达92.4%,有效降低用户举报率,优化推荐体验,助力平台内容生态健康发展。

AI解说大师

AI解说大师是一款基于人工智能技术打造的短剧解说视频创作平台,拥有正版素材库、智能文案生成、语音与字幕处理等功能,可一键生成高品质解说视频,适用于社交媒体营销、教育学习、企业宣传等多个领域,助力用户高效完成内容创作。

World Labs 空间智能模型

World Labs 空间智能模型是一款基于人工智能技术的工具,能够通过单张图片生成逼真的3D世界,并支持实时渲染与交互操作。其核心功能包括3D几何估算、场景补全、内容生成及相机效果模拟,广泛应用于电影、游戏、虚拟现实、教育以及建筑设计等多个领域,大幅提升了创作效率与视觉表现力。

Hotpot.Ai

Hotpot.ai 是一个可让您在线创建和编辑图像,可以使用它来制作logo、图标、插图、漫画、模板等设计的网站。

Baidu Comate

Baidu Comate是百度推出的A编程工具,基于文心大模型,可实现代码的快速补齐、自然语言推荐代码、自动查找代码错误,全面提升开发者研发效率。

AnyStory

AnyStory是阿里巴巴通义实验室开发的文本到图像生成工具,支持单个或多个主体的高保真图像生成。其核心在于“编码-路由”架构,结合ReferenceNet和CLIP视觉编码器实现主体特征的精准建模与定位。通过解耦路由机制,有效避免多主体混淆,确保图像与文本描述高度一致。适用于创意设计、角色生成、广告制作等多个场景,提供高质量、个性化的图像生成能力。

PixelHacker

PixelHacker是一款由华中科技大学与VIVO AI Lab联合开发的图像修复模型,采用潜在类别引导机制,通过线性注意力实现结构与语义一致性的高质量修复。基于大规模数据集训练并经过多基准微调,支持多种图像类型与分辨率。适用于照片修复、对象移除、艺术创作、医学影像及文化保护等领域。

Evoto

Evoto是一款以提升照片编辑效率为核心的AI工具,拥有精准的人脸识别、自然的皮肤美化、高级色彩调节、背景替换及批量处理等功能。它通过提供专业设计师设计的独特预设,帮助用户快速达到专业级图像处理效果,适用于人像摄影、婚礼摄影、时尚摄影、产品摄影及社交媒体内容创作等多个领域。