2025-01-10 基于边缘检测算法检测视频中文字 python 基于边缘检测算法检测视频中文字 思路 核心挑战: 动态变化: 字幕的位置、大小、颜色、字体、背景等都会动态变化。 复杂背景: 字幕通常叠加在复杂的视频背景上。 时间连贯性: 字幕通常在一段时间内持续出现,并非只出现一帧。 精度要求: 要尽
2025-01-10 在ubuntu系统使用docker安装 CVAT python 在ubuntu系统使用docker安装 CVAT CVAT 是一个免费、开源的 Web 应用程序,用于标注计算机视觉任务的数据集。它由 Intel 开发并维护,旨在为各种计算机视觉应用提供一个高效、强大且协作式的标注平台。 功能 多
2024-12-25 label studio引入nemo_asr实现预测标注文本 python label studio引入nemo_asr实现预测标注文本clone and use1git clone https://github.com/HumanSignal/label-studio-ml-backend install123
2024-12-17 在label studio 引入whisper 实现语音转写与说话人分离 python 在label studio 引入whisper 实现语音转写与说话人分离Label Studio 介绍 Label Studio 是一个开源的数据标注工具,广泛应用于机器学习和人工智能项目中,用于标注各种类型的数据,如文本、图像、音频、视频
2024-12-15 CentOS 系统上安装 Docker python CentOS 系统上安装 Docker前提条件: CentOS 系统: 确保你使用的是 CentOS 7 或更高版本。 具有 sudo 权限的用户: 你需要一个具有 sudo 权限的用户来执行这些命令。 网络连接: 你的 CentOS 系
2024-12-15 基于Easyocr的文字识别 python 基于Easyocr的文字识别 EasyOCR 是一个开源的 OCR (光学字符识别) 工具,能够快速并高效地从图像中提取文本。与其他OCR工具如 Tesseract 相比,EasyOCR 具有更强的多语言支持,包括对中文、日语、阿拉伯语等复
2024-11-16 使用js log库和python FastApi完成 微信小程序日志保存与上传 python 使用js log库和python FastApi完成 微信小程序日志保存与上传简介 使用log.js 通过定义日志输出格式:console.log([${log.level}] ${log.timestamp&
2024-08-21 pyqt5信号槽机制应用 python pyqt5信号槽机制应用简介 PyQt5中的信号和槽是用于对象之间的事件处理和通信的一种机制。信号在某个特定事件发生时发出,槽是用来响应这些信号的函数。信号(Signal)与槽(Slot)是Qt中的核心机制,也是在PyQt编程中对象之间进行
2024-08-21 python 使用tesseract实现实时监控桌面 pythontesseract python 使用tesseract实现实时监控桌面技术介绍 Tesseract是一个 由HP实验室开发 由Google维护的开源的光学字符识别(OCR)引擎,可以在 Apache 2.0 许可下获得。它可以直接使用,或者(对于程序员)使用
2024-08-19 使用python实现简易截图功能 python 使用python实现简易截图功能技术方案pyautogui pyautogui 模块,使用screenshot() 函数和save() 函数实现 基础demo 需要先安装pyautogui库 1pip install pyautogui