admin

admin

这家伙很懒,什么也没写

加入时间 8年前

TA的文章

DDColor图像上色

DDColor图像上色

一个为黑白图像上色的魔搭模型,通过双解码器实现逼真的图像着色,输入一张黑白图像,实现端到端的全图上色,返回上色处理后的彩色图像。
Lumiere

Lumiere

谷歌研究院开发的基于空间时间的文本到视频扩散模型。采用了创新的空间时间U-Net架构,能够一次性生成整个视频的时间长度,确保了生成视频的连贯性和逼真度。
Diffuse to Choose

Diffuse to Choose

一种基于扩散的图像修复模型,主要用于虚拟试穿场景。它能够在修复图像时保留参考物品的细节,适用于在线购物等虚拟试穿场景中的图像修复任务。
DuckDB

DuckDB

一个专门为DuckDB数据库设计的文本到SQL的模型,你可以使用自然语言说描述你的需求,它会自动转换成SQL代码。
StreamRAG

StreamRAG

一个视频搜索和流媒体代理工具,能让您在 ChatGPT 中与您的视频库聊天并观看视频流。
WhisperFusion

WhisperFusion

一个基于WhisperLive把声音转文字和WhisperSpeech理解这些文字的能力构建。能够与AI聊天机器人进行超低延迟对话。
Audio2Face

Audio2Face

一款由AI驱动的应用程序,通过语音生成富有表现力的3D面部动画。
Media2Face

Media2Face

一款革命性的语音面部动画生成工具,借助 Media2Face,现在可以从任何音频、图像或文本输入无缝生成逼真且富有表现力的面部动画。
YOLO

YOLO

腾讯AI实验室开发的一个实时目标检测工具,它能够自动识别和定位图像中的各种对象
SoraWebui

SoraWebui

一个开源项目,允许用户使用 OpenAI Sora 模型使用文本在线生成视频,从而简化视频创建,并具有轻松的一键网站部署功能。

微信公众账号

微信扫一扫加关注

返回
顶部