DeepSeek最新多模态大模子：Janus-Pro-7B腹地部署完好意思指南

发布日期：2025-03-05 09:14 点击次数：67

专题：DeepSeek为何能搬动巨匠AI圈

　　起首：小蔡AI现实室

　　最近DeepSeek王炸持续，刚刚出了火爆巨匠的R1大模子，但还有大招没放！

　　就在刚刚，准备在多模态大模子正掀翻新一轮技能立异海潮！

　　DeepSeek新出的Janus-Pro-7B系列当作业界首个剖析-生成一体化架构的顶端模子，完结了：

　　🔥 五大颠覆性上风 ✅ 视觉问答准确率卓绝GPT-4V ✅ 文生图质地卓绝DALL·E3、Stable Diffusion 3 ✅ 单卡即可初始的高效推理 ✅ 企业级数据狡饰安全保险

　　本教程将带您完成15分钟极速部署，R1大模子独一你机器够，表面上也不错部署哦。

技俩地址：https：//github.com/deepseek-ai/Janus？tab=readme-ov-file#simple-inference-example-1

模子地址：https：//huggingface.co/deepseek-ai/Janus-Pro-7B/discussions

　　环境条目

操作系统： Linux/Windows （保举 Ubuntu 20.04+）

Python： 3.8+

CUDA： 11.7+ （需与PyTorch版块匹配）

GPU：显存 ≥16GB （Janus-Pro-7B需≥24GB）

存储空间： ≥30GB 可用空间

　　快速部署

　　1．克隆代码库

　　git clone https：//github.com/deepseek-ai/Janus.gitcd Janus

　　2．创建捏造环境

　　conda create -n janus python=3.8 -yconda activate janus// 这一步也不错使用pycharm代替

　　3．安设依赖

　　pip install torch==2.0.1+cu117 --index-url https：//download.pytorch.org/whl/cu117pip install -r requirements.txtpip install -e ．[gradio] # 安设Gradio膨大

　　安设完成后如下：

　　模子下载

　　设施一：使用 huggingface-cli 用具

　　安设下载用具

　　pip install huggingface_hub

　　下载完满模子（保举）

　　# 下载7B版块到指定目次huggingface-cli download deepseek-ai/Janus-Pro-7B \ --local-dir ．/models/Janus-Pro-7B \ --resume-download \ --cache-dir ．/cache

　　下载指定文献

　　# 下载配置文献huggingface-cli download deepseek-ai/Janus-Pro-7B config.json --local-dir ．/models# 下载中枢模子文献huggingface-cli download deepseek-ai/Janus-Pro-7B pytorch_model.bin --local-dir ．/models

　　下载参数阐扬

　　| | | | | --- | --- | --- | | 参数 | 阐扬 | 示例 | | --local-dir | 指定下载目次 | --local-dir ．/models | | --cache-dir | 设立缓存旅途 | --cache-dir ．/cache | | --resume-download | 断点续传 | 自动续传中断的下载 | | --revision | 指定版天职支 | --revision main |

　　设施二：代码自动下载

　　from transformers import AutoModelForCausalLM# 自动下载到缓存目次model = AutoModelForCausalLM.from_pretrained（“deepseek-ai/Janus-Pro-7B”）# 指定腹地旅途（需先通过huggingface-cli下载）model = AutoModelForCausalLM.from_pretrained（“．/models/Janus-Pro-7B”）

　　使用示例

　　加载腹地模子

　　model_path = “．/models/Janus-Pro-7B” # 指向下载目次processor = VLChatProcessor.from_pretrained（model_path）model = MultiModalityCausalLM.from_pretrained（model_path）．to（“cuda”）

　　常见问题

　　下载速率慢

使用国内镜像源：

　　HF_ENDPOINT=https：//hf-mirror.com huggingface-cli download．．．

开启多线程下载：

　　huggingface-cli download ．．． --workers 8

　　文献校验失败

　　实施完满性校验：

　　huggingface-cli download ．．． --force-redownload

　　技能阐扬

模子文献结构：

Janus-Pro-7B/├── config.json├── pytorch_model.bin├── tokenizer_config.json└── special_tokens_map.json

缓存机制：默许缓存旅途为 ~/．cache/huggingface/hub，可通过 --cache-dir 自界说

　　手动下载

看望HuggingFace仓库

下载Janus-Pro-7B模子文献

解压到腹地目次．/models/Janus-Pro-7B

　　使用示例

　　多模态剖析

　　# inference_demo.pyimport torchfrom janus.models import MultiModalityCausalLM， VLChatProcessormodel_path = “．/models/Janus-Pro-7B”processor = VLChatProcessor.from_pretrained（model_path）model = MultiModalityCausalLM.from_pretrained（model_path）．to（“cuda”）# 构建对话conversation = [ { “role”： “<|User|>”， “content”： “\n描述这张图片的本体”， “images”： [“sample.jpg”] }， {“role”： “<|Assistant|>”， “content”： “”}]# 解决输入并生成反馈inputs = processor（conversations=conversation）outputs = model.generate（**inputs）print（processor.decode（outputs[0]））

　　文生图功能

　　# generate_image.pyfrom janus.utils import generate_imageprompt = “夕阳下的雪山，山眼下有蓝色的湖泊”generate_image（ model_path=“．/models/Janus-Pro-7B”， prompt=prompt， output_dir=“．/outputs”， num_images=4）

　　Gradio 腹地演示

　　# 启动文本交互界面python demo/app_text.py --model-path ．/models/Janus-Pro-7B# 启动多模态界面python demo/app_multimodal.py \ --model-path ．/models/Janus-Pro-7B \ --port 7860

　　看望 http://localhost：7860 使用交互界面