Files
akmon/doc_camera/cam.md
2026-01-20 08:04:15 +08:00

4.7 KiB
Raw Blame History

基于 AI 智能摄像头功能规划书

1. 概述

本方案基于智能视频处理器设计。内置高性能 AI 算力引擎,支持 4K 高清分辨率。本方案重点利用其低功耗 AOV (Always-On Video) 技术和端侧 AI 推理能力,打造具备极速启动、精准识别和超长续航的智能视觉产品。

2. 核心 AI 功能列表

芯片内置 NPU 提供约 4Tops (INT8 稀疏算力) / 1.2Tops (实际有效算力) 的处理能力,支持以下端侧实时算法:

2.1 视觉感知类

功能名称 描述 典型应用场景
人形检测 (Human Detection) 毫秒级识别画面中的人体,过滤飞虫、光线变化等误报。支持人形框选、移动轨迹追踪。 安防监控、入侵报警
人脸识别/抓拍 (Face Recognition) 本地人脸库比对(支持 1000+ 人脸库),识别家庭成员、陌生人、黑名单人员。 智能门铃、家庭看护
车辆检测 (Vehicle Detection) 识别画面中的轿车、卡车、摩托车、自行车等,支持车辆滞留检测。 庭院停车监控、车库管理
宠物检测 (Pet Detection) 识别猫、狗等常见宠物,支持宠物活动区域记录。 宠物看护机
包裹检测 (Package Detection) 识别门口地面是否有包裹遗留或被拿走。 智能门铃
跌倒检测 (Fall Detection) 识别老人或儿童的跌倒姿态(需配合特定角度安装)。 养老看护

3. 核心技术特性 ( 优势)

  • AOV (Always-On Video) 超低功耗录像:
    • 支持 7x24 小时持续录像,但功耗极低(< 200mW
    • 无事件时以超低帧率(如 1fps录制检测到 AI 事件如人形瞬间切换至高帧率25/30fps全彩录制。
    • 解决传统 PIR 漏报和启动慢的问题。
  • 极速启动 (Fast Boot):
    • 冷启动至出图时间 < 300ms确保抓拍不遗漏。
  • 黑光全彩 (Starlight ISP):
    • 强大的 ISP 性能,支持微光环境下全彩成像,减少红外补光带来的画面细节丢失。

4. 主要应用场景规划

场景一:智能电池门铃 / 门锁猫眼 (Smart Doorbell)

  • 核心痛点: 续航短、反应慢、误报多。
  • ** 解决方案**:
    • 利用 PIR + AI 人形复核,彻底消除误报。
    • 包裹检测: 快递员放下包裹即刻提醒,包裹被拿走报警。
    • 人脸识别: 门铃响起前,识别身份并推送通知(如“快递员来了”或“爸爸回来了”)。

场景二:户外低功耗枪球联动摄像机 (Outdoor Battery PTZ)

  • 核心痛点: 户外无电源、监控范围大、夜间效果差。
  • ** 解决方案**:
    • AOV 模式: 即使没有太阳能,也能实现全天候低帧率记录,不错过任何瞬间。
    • 车辆/人形分类检索: 快速筛选录像,只看有人或有车的片段。
    • 声光警戒: 检测到人形入侵设定区域(电子围栏),闪烁白光驱离(声音警戒规划在二期)。

场景三:室内 AI 看护机 (Indoor Care Camera)

  • 核心痛点: 隐私泄露、只能看不能互动。
  • ** 解决方案**:
    • 本地 AI 处理: 人脸和人形数据本地计算,不上传云端,保护隐私。
    • 虚拟围栏: 婴儿爬出安全区域(如厨房)时报警。

5. 硬件接口需求参考

  • Sensor: 适配 400万/500万像素传感器。
  • Audio: 支持双向语音对讲,回声消除 (AEC)。
  • Network: Wi-Fi 6 模组 (高吞吐) 或 4G Cat.1 (广覆盖)。
  • Storage: SD 卡 + 云存储 (支持加密传输)。

6. 第二期规划 (Phase 2) - 语音、听觉与交互智能

本阶段将重点补充音频及交互相关的高级 AI 功能。

6.1 视觉交互类

功能名称 描述 典型应用场景
手势识别 (Gesture Recognition) 识别特定手势如“OK”、“手掌”用于触发呼叫或控制设备。 儿童陪伴、老人呼叫

6.2 听觉感知类 (Audio AI)

功能名称 描述 典型应用场景
哭声检测 (Crying Detection) 识别婴儿哭声,及时推送报警。 婴儿监护器
异响检测 (Abnormal Sound) 识别玻璃破碎声、尖叫声、烟雾报警器声。 家庭安防

6.3 语音交互类

  • 变声对讲: 独居女性可使用“大叔音”进行远程对讲,提升安全性。
  • 语音播报: 基于人脸识别结果,本地播报访客身份(如“快递员来了”)。
  • 声光警戒 (声音部分): 配合人形检测播放警告音。
  • 手势呼叫: 老人对着摄像头做“打电话”手势,自动呼叫子女手机 APP。