简介
概述
AXCL 是用于在 M.2算力卡 上开发深度神经网络推理、转码等应用的 C、Python 语言 API 库,提供运行资源管理,内存管理,模型加载和执行,媒体数据处理等 API,其逻辑架构图如下图所示:
概念
AXCL 运行时库有 Device、Context、Stream、Task 等基本概念,其关系如下图所示:
Device:提供计算和媒体处理的硬件设备,通过 PCIe 接口和 Host 连接。
Device 的生命周期源于首次调用
axclrtSetDevice接口。Device 使用引用计数管理生命周期,
axclrtSetDevice引用计数加 1,axclrtResetDevice引用计数减1。当引用计数减少为零时,本进程中的 Device 资源不可用。
若存在多个 Device,多个 Device 之间的内存资源不能共享。
Context:执行上下文容器,管理包括 Stream,内存等生命周期,Context 和应用线程绑定。Context 一定隶属于一个唯一的 Device。Context 分为隐式和显示两种:
隐式 Context(即默认 Context):
调用
axclrtSetDevice接口指定设备时,系统会创建一个隐式 Context,当axclrtResetDevice接口引用计数为零时隐式 Context 被自动销毁。一个 Device 只会有一个隐式 Context,隐式 Context 不能通过
axclrtDestroyContext接口销毁。
显示Context:
调用
axclrtCreateContext接口显示创建,调用axclrtDestroyContext接口销毁。进程内的 Context 是共享的,可以通过
axclrtSetCurrentContext进行切换。推荐应用为每个线程中创建和销毁显示 Context。
Stream:执行任务流,隶属于 Context,同一个 Stream 的任务执行保序。Stream 分为隐式和显示两种:
隐式 Stream(即默认 Stream):
每个 Context 都会创建一个隐式 Stream,生命周期归属于 Context。
native sdk 模块(比如
AXCL_VDEC_XXX、AXCL_SYS_XXX等)使用隐式 Stream。
显示Stream:
由
axclrtCreateStream接口创建,由axclrtDestroyStream接口销毁。当显示 Stream 归属的 Context 被销毁或生命周期结束后,即使该 Stream 没有被销毁,亦不可使用。
Task:Device 任务执行实体,应用不可见。
应用线程和Context
一个应用线程一定会绑定一个 Context,所有Device的任务都必须基于 Context。
一个线程中当前会有一个唯一的 Context,Context 中绑定了本线程任务执行的 Device。
应用线程中支持通过
axclrCreateContext创建多个 Context,但一个线程同一时刻只能使用一个 Context。连续创建多个 Context,线程绑定的是最后一个创建的 Context。进程内支持通过
axclrtSetCurrentContext绑定当前线程的 Context,连续多次调用axclrtSetCurrentContext,最终绑定的是最后一次的 Context。多线程推荐为每个线程显示创建一个Context。
推荐通过
axclrtSetCurrentContext切换 Device。
小技巧
SDK axcl/sample/runtime 提供了如何在线程中创建和销毁Context的示例代码。