本文最后更新于 2022年9月2日 修改人 YiMiLi
统一、全面、高效的小白兔AI,依赖强大的自研AI引擎,整合并持久优化,现已支持抠图、人像动漫化、动漫超分辨、音频降噪、语音合成、OCR识别等十余种AI功能,GPU加速推理,Inter、NVDIA、AMD全支持。
已内置功能 | 适用场景 | 功能简介 |
---|---|---|
RealCugan-Pro动漫超分辨 | 动漫图片或视频超分辨放大 | 自研AI引擎驱动,可获得最高质量的动漫超分辨效果,可能是目前唯一可轻松使用RealCugan-Pro模型的软件 |
RealESRGAN动漫超分辨 | 动漫图片或视频 | 推理速度快,质量比waifu2x好太多,常规超分辨首选 |
智能抠图 | 任意图片或视频 | 推理速度快,一键获得透明图片或绿幕视,进行二次创作 |
人像动漫化 | 仅适合头像处理 | 转换效果出众,有趣又好玩 |
语音合成 | 自媒体视频配音、有声读书等 | 效果逼近真人,发音自然、带呼吸声、音色千变万化 |
录音降噪 | 真人配音后处理 | 一键去除环境和背景噪音,提升录音清晰度,效果明显 |
视频补帧 | 运动类视频流畅度升级工具 | 可获得丝滑观感,已支持RIFE和IFRNET两种AI模型 |
AI一键跑分 | 一键查看设备AI性能数据 | 模拟真实推理任务,统一量化推理任务,耗时越小越好 |
图片OCR识别 | 图片转文字 | 基于Paddle-OCR-v3模型,迄今最优秀的OCR识别模型、效果出众 |
软件现已支持手动调整并发数,可根据设备显卡体质自行调整,实现GPU的最大化利用率,因此不论是笔记本低端显卡还是RTX 3090TI都能充分释放设备性能。
开发者计划:
- AI新功能:语音识别、视频字幕提取、人脸修复、旧图片上色修复、多目标抠图等等
- 跨端支持:Windows、Mac、Colab、WASM
- 待突破:disco diffusion、deepfake、人声+背景音乐分离
GitHub项目页面:https://github.com/Baiyuetribe/paper2gui