RK3588开发板部署Qwen2.5-7B大语言模型实战-嵌云网-嵌入式AI开发资源站

RK3588开发板部署Qwen2.5-7B大语言模型实战

Noamwa

1. RK182X-RK3588套件大语言模型本地部署概述

在边缘计算设备上部署大语言模型（LLM）是当前AI领域的热门方向之一。Rockchip推出的RK182X-RK3588套件为开发者提供了一个高性能、低功耗的本地化LLM部署解决方案。本文将详细介绍如何在RK182X-RK3588开发套件上部署Qwen2.5-7B大语言模型的全过程。

这套方案的核心优势在于：

利用RK3588的NPU加速计算
支持8位量化（W8A8）降低模型体积
完整的工具链支持从模型转换到部署
针对边缘设备优化的运行时环境

提示：整个部署过程涉及虚拟机环境准备、SDK编译、模型转换和开发板部署等多个环节，建议预留至少50GB磁盘空间和32GB以上内存。

2. 环境准备与SDK编译

2.1 获取SDK源码

首先需要联系Rockchip官方或授权代理商获取RK182X AI协处理器SDK。目前最新版本为RK182X_AI_COPROCESSOR_SDK_ALPHA_V1.0.0.tgz。建议在Ubuntu 20.04 LTS虚拟机环境中进行操作。

2.2 SDK编译详细步骤

解压与初始化

bash复制# 创建专用工作目录
mkdir -p ~/rk182x_sdk && cd ~/rk182x_sdk

# 解压SDK包（假设已放置在当前目录）
tar xf RK182X_AI_COPROCESSOR_SDK_ALPHA_V1.0.0.tgz

# 初始化repo
.repo/repo/repo sync -l

配置与编译

配置时会出现板型选择菜单，根据实际硬件选择对应选项：

code复制Select board type:
1) RK182X EVB1
2) RK182X SODIMM  # 大多数开发板选择此项
3) RK182X SODIMM USB
4) RK182X M2
5) Cancel
#? 2

完整编译命令：

bash复制./build.sh

编译完成后，生成的固件包位于：

code复制output/firmware/rknn3_rk182x_sodimm_installer_arm64.tgz

注意事项：编译过程可能需要1-2小时，取决于主机性能。建议虚拟机分配至少8核CPU和16GB内存。

3. 开发板环境配置

3.1 固件安装

将生成的固件包传输到RK3588开发板（可通过scp或U盘），然后执行：

bash复制# 创建安装目录
mkdir -p ~/RK182X && cd ~/RK182X

# 解压安装包
tar xzf /path/to/rknn3_rk182x_sodimm_installer_arm64.tgz

# 执行安装
./install.sh

# 必须重启使配置生效
sudo reboot

3.2 验证安装

重启后检查NPU驱动状态：

bash复制sudo rknn-smi -v

正常输出应包含PCIe驱动版本和固件版本信息：

code复制rknn-smi version : 1.1.0
PCIe driver version : 3.3.0
RC chips connect version : 3.2.0
EP chips connect version : 3.2.0
PCIe Device 0 firmware version: 1.0.0
rknn3 API version : 1.0.0

如果显示"NA"值，说明安装未成功，需要检查PCIe连接或重新安装。

4. RKLLM-Toolkit环境搭建

4.1 Conda环境配置

建议使用Miniconda+Miniforge组合管理Python环境：

bash复制# 安装Miniconda
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh

# 安装Miniforge
wget -c https://mirrors.bfsu.edu.cn/github-release/conda-forge/miniforge/LatestRelease/Miniforge3-Linux-x86_64.sh
bash Miniforge3-Linux-x86_64.sh

# 创建专用环境
conda create -n RKLLM-Toolkit python=3.9 -y
conda activate RKLLM-Toolkit

4.2 RKNN-LLM工具链安装

bash复制# 克隆指定版本仓库
mkdir -p ~/RKSDK && cd ~/RKSDK
git clone -b release-v1.2.3 https://github.com/airockchip/rknn-llm.git

# 安装对应版本的wheel包
cd rknn-llm/rkllm-toolkit/packages
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple rkllm_toolkit-1.2.3-cp39-cp39-linux_x86_64.whl

验证安装：

python复制python -c "from rkllm.api import RKLLM; print('Import success')"

5. 模型转换与优化

5.1 下载Qwen2.5-7B模型

使用HuggingFace镜像加速下载：

bash复制export HF_ENDPOINT=https://hf-mirror.com
pip install huggingface_hub
huggingface-cli download Qwen/Qwen2.5-7B-Instruct --local-dir ./Qwen2.5-7B-Instruct --resume-download

注意：完整模型约14GB，确保有足够磁盘空间。下载时间取决于网络状况。

5.2 模型转换配置

进入转换脚本目录：

bash复制cd ~/RKSDK/rknn-llm/examples/rkllm_api_demo/export

修改export_rkllm.py中的模型路径：

python复制modelpath = '/path/to/your/Qwen2.5-7B-Instruct'

对于内存不足的情况，可采取以下措施：

bash复制# 创建16GB交换文件
sudo fallocate -l 16G /swapfile2
sudo chmod 600 /swapfile2
sudo mkswap /swapfile2
sudo swapon /swapfile2

5.3 执行模型转换

bash复制python3 export_rkllm.py

转换过程可能耗时2-4小时，成功后会生成：

code复制Qwen2.5-7B-Instruct_W8A8_RK3588.rkllm

6. 交叉编译与部署准备

6.1 安装交叉编译工具链

下载并解压ARM交叉编译工具：

bash复制wget https://developer.arm.com/-/media/files/downloads/gnu/11.2-2022.02/binrel/gcc-arm-11.2-2022.02-x86_64-aarch64-none-linux-gnu.tar.xz
tar -xf gcc-arm-11.2-2022.02-x86_64-aarch64-none-linux-gnu.tar.xz

6.2 编译llm_demo

bash复制cd ~/RKSDK/rknn-llm/examples/rkllm_api_demo/deploy
vim build-linux.sh  # 修改GCC_COMPILER_PATH路径
chmod +x ./build-linux.sh
./build-linux.sh

6.3 打包部署文件

bash复制mkdir -p ~/rkllm_deploy
cp ~/RKSDK/rknn-llm/examples/rkllm_api_demo/export/Qwen2.5-7B-Instruct_W8A8_RK3588.rkllm ~/rkllm_deploy/
cp ~/RKSDK/rknn-llm/examples/rkllm_api_demo/deploy/install/demo_Linux_aarch64/llm_demo ~/rkllm_deploy/
cp ~/RKSDK/rknn-llm/examples/rkllm_api_demo/deploy/install/demo_Linux_aarch64/lib/librkllmrt.so ~/rkllm_deploy/
cp ~/RKSDK/rknn-llm/scripts/fix_freq_rk3588.sh ~/rkllm_deploy/ || echo "定频脚本不存在，跳过"
chmod +x ~/rkllm_deploy/llm_demo
tar -czf rkllm_deploy.tar.gz rkllm_deploy/

7. 开发板最终部署

7.1 解压与准备

将打包文件传输到开发板后：

bash复制tar -xzf rkllm_deploy.tar.gz
cd rkllm_deploy

7.2 设置定频（提升性能）

bash复制sed -i 's|#!/system/bin/sh|#!/bin/bash|' fix_freq_rk3588.sh
chmod +x fix_freq_rk3588.sh
sudo ./fix_freq_rk3588.sh

7.3 运行LLM演示

bash复制export LD_LIBRARY_PATH=./:$LD_LIBRARY_PATH
./llm_demo ./Qwen2.5-7B-Instruct_W8A8_RK3588.rkllm 4096 512

参数说明：

4096：最大上下文长度
512：最大生成token数

8. 常见问题与解决方案

8.1 编译相关问题

问题1：repo sync失败
解决方案：

bash复制.repo/repo/repo sync -c --no-tags -j$(nproc)

问题2：内存不足导致编译中断
解决方案：

bash复制sudo fallocate -l 8G /swapfile
sudo chmod 600 /swapfile
sudo mkswap /swapfile
sudo swapon /swapfile

8.2 模型转换问题

问题：转换过程中被kill
可能原因：

内存不足（至少需要32GB物理内存）
交换空间不足

解决方案：

bash复制# 查看内存使用情况
free -h

# 增加交换空间（示例增加16GB）
sudo dd if=/dev/zero of=/swapfile2 bs=1G count=16
sudo chmod 600 /swapfile2
sudo mkswap /swapfile2
sudo swapon /swapfile2

8.3 部署运行时问题

问题：加载模型时报错"RKLLM_ERR_MODEL_INVALID"
可能原因：

模型文件损坏
运行时版本不匹配