架构

首页

架构

列表

默认

浏览次数

发布日期

PixArt

PixArt

PixArt-Σ是一款基于扩散Transformer架构（DiT）的文本生成图像模型，专为生成高达4K分辨率的高质量图像而设计。该模型通过整合高级元素并采用从弱到强的训练方法，不仅提升了生成图像的保真度，还增强了图像与文本提示之间的对齐效果。PixArt-Σ的生成图像在美学质量上可媲美当前顶级的文本到图像产品，并且在遵循文本提示方面表现出色。主要功能包括4K分辨率图像生成、高保真转换、高效率训练和

AI项目与工具 2024年01月01日 82 点赞 0 评论 868 浏览

VideoPoet

VideoPoet

VideoPoet是一款基于大模型的AI视频生成工具，支持从文本、图像或视频输入中合成高质量的视频内容及匹配的音频。其核心优势在于多模态大模型设计，能够处理和转换不同类型的输入信号，无需特定数据集或扩散模型即可实现多种风格和动作的视频输出。主要功能包括文本到视频转换、图像到视频动画、视频风格化、视频编辑和扩展、视频到音频转换以及多模态学习等。技术原理涉及多模态输入处理、解码器架构、预训练与任务适应

AI项目与工具 2024年01月01日 98 点赞 0 评论 662 浏览

PengChengStarling

PengChengStarling

鹏城实验室开源的一款多语言语音识别系统开发工具包，PengChengStarling可以在统一的框架内处理多种语言语音输入，支持实时语音识别，边说边识别。

Ai语音工具 2025年06月05日 66 点赞 0 评论 537 浏览

Mureka Ai

Mureka Ai

Mureka Ai

一款AI音乐商用创作平台，Mureka Ai集成了音乐生成、编辑和版权交易功能。

Ai语音工具 2025年06月05日 11 点赞 0 评论 669 浏览

Comet浏览器

Comet浏览器

一款由Perplexity AI开发的AI浏览器，这款浏览器支持自主任务执行、上下文理解和个性化交互，智能历史检索、代理搜索和隐私保护等功能，超越传统的检索。

AI搜索问答 2025年06月05日 35 点赞 0 评论 603 浏览

UIGEN

UIGEN

一个基于 Qwen2.5-Coder-7B 模型微调的开源 UI 设计生成工具，能够根据用户输入的提示生成结构清晰且符合标准的 HTML 和 CSS 代码

Ai编程建站 2025年06月05日 44 点赞 0 评论 870 浏览

DeepSeek Coder

DeepSeek Coder

中国人工智能公司深度求索（DeepSeek）推出的开源代码生成大模型系列，通过深度学习技术提升代码生成和理解能力，提升开发者的编程效率。

Ai编程建站 2025年06月05日 24 点赞 0 评论 675 浏览

代码小浣熊Raccoon

代码小浣熊Raccoon

代码小浣熊Raccoon

代码小浣熊 Raccoon，基于商汤自研大语言模型的AI智能编程助手。

Ai编程建站 2025年06月05日 30 点赞 0 评论 470 浏览

TryOnDiffusion

TryOnDiffusion

TryOnDiffusion就谷歌推出的一项新虚拟试穿功能，能够实现高度逼真的虚拟试穿，用户能够直观地看到不同体型的人穿着不同尺寸的衣服效果如何。

Ai开源项目 2025年06月05日 26 点赞 0 评论 575 浏览

Jan.ai

Jan.ai

ChatGPT 的开源、托管替代品，jan.ai可在您的计算机上100%离线运行。

Ai开源项目 2025年06月05日 78 点赞 0 评论 734 浏览

微信公众账号

微信扫一扫加关注