开源工具

AutoStudio
AutoStudio:在多轮交互式图像生成中制作一致的主题 AutoStudio: Craf...

Medical-SAM2
● 医疗 SAM 2:通过 Segment Anything Model 2 将医疗图像分割为...


ml-mdm
以数据和计算高效的方式训练高质量的文本到图像扩散模型 Train high-quality ...

HivisionIDPhotos
一个轻量级的AI证件照制作算法。 HivisionIDPhotos: a lightweig...


visual-try-on
一款 Chrome 扩展,可轻松对任何电子商务商店的服装进行视觉试用。填写下面的表格以获得有关...


hallo
Hallo:用于人像图像动画的分层音频驱动视觉合成 Hallo: Hierarchical ...

EvTexture
[ICML 2024] EvTexture:事件驱动的视频超分辨率纹理增强 [ICML 20...


Deep-Live-Cam
实时换脸和一键视频深度伪造,仅使用单个图像(未经审查) real time face swa...


MIMO
《MIMO:空间分解建模的可控字符视频合成》正式实现。MIMO是一种可推广的可控视频合成模型,...





FunASR
基本的端到端语音识别工具包和开源SOTA预训练模型。 A Fundamental End-t...

OpenVoice
通过MyShell进行即时语音克隆。 Instant voice cloning by My...