微软发布了可发送和接收图片的 ChatGPT - VisualChatGPT--粉丝服务平台-粉丝头条-fensifuwu.com

微软发布了可发送和接收图片的 ChatGPT - VisualChatGPT

日期： 2023-03-11 23:17:11 来源：Github爱好者收集编辑：

Visual ChatGPT 连接了 ChatGPT 和一系列的 Visual Foundation 模型，以便在聊天过程中发送和接收图像。

下图为演示效果：

对该应用实现感兴趣的可以查看其论文 Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Models(https://arxiv.org/abs/2303.04671)。

整个系统架构如下所示：

要安装的话可以安装下面的命令步骤进行：

# create a new environment
conda create -n visgpt python=3.8

# activate the new environment
conda activate visgpt

#  prepare the basic environments
pip install -r requirement.txt

# download the visual foundation models
bash download.sh

# prepare your private openAI private key
export OPENAI_API_KEY={Your_Private_Openai_Key}

# create a folder to save images
mkdir ./image

# Start Visual ChatGPT !
python visual_chatgpt.py

下面列出了每个视觉基础模型的 GPU 内存使用情况，可以修改 self.tools 使用较少的视觉基础模型来节省您的 GPU 内存：

Foundation Model	Memory Usage (MB)
ImageEditing	6667
ImageCaption	1755
T2I	6677
canny2image	5540
line2image	6679
hed2image	6679
scribble2image	6679
pose2image	6681
BLIPVQA	2709
seg2image	5540
depth2image	6677
normal2image	3974
InstructPix2Pix	2795

Github地址：https://github.com/microsoft/visual-chatgpt

服务粉丝

微软发布了可发送和接收图片的 ChatGPT - VisualChatGPT

文章推荐

相关阅读

为什么大佬debug五分钟，你却要两小时

假如变量名允许以数字开头...

正常的乳房到底长什么样？（内附图解）

初中语文答题模板，学霸技巧书，不容错过

互联网大厂 | 8大职类、超高转正率！字节跳动2024届实习生招聘正式启动！

大型央企 | 中国三峡集团2023年高校毕业生春季招聘启动！

互联网大厂 | 阿里巴巴春季2024届实习生招聘全球启动！

部分年薪35万+！有七险二金、人才公寓！杭州地铁|事业单位|内勤|大厂…招聘中！

淘好物，品美食！杭州这些宝藏杂货市场、菜场，你知道几个？

参会抽RTX 4090，GTC23 China AI Day定档3月22日，嘉宾阵容公布

聚合标签

热门文章

百元茅台没人买，千元茅台有人追。十年前，有人花百元买了一万股茅台，后出手追中石油，如今，茅台一飞冲天，中石油深套十年。炒股，不要见异思迁，价值投资是首选。#股票#

谁说定期存款提前支取不划算？存中原银行“惠农宝”放心随便取

张小龙:交了8千万税无北京户籍孩子连私立也不让上

万字详解：ROE连续十年超过20的明星公司全面分析（附：详细名单）

“复活”半年后　京东拍拍二手杀入公益事业

离职时没有做满一个月，公司还需要帮纳当月社保吗？

最新文章

微软发布了可发送和接收图片的 ChatGPT - VisualChatGPT

为什么大佬debug五分钟，你却要两小时

插座不够用，电源线总是杂乱无章？试试它，一次可充数台设备，能伸能缩，还自带收纳，再也不怕充电头“缠绕打架”了！

又是一年毕业季，收好这份超全的毕业论文格式修改攻略！

1篇Nature和2篇ACS Catalysis：ZnOx/silicalite-1如何催化丙烷脱氢？

90万个招嫖账号，快手成了“午夜红灯区”？居然还亏了120亿！