Loading...

Acceso a TODOS los cursos por tan solo $3 USD

7h de duración total

89 Clases

Acceso de por vida

Contenido 100% descargable


Udemy Programacion

Intelligently Extract Text & Data from Document with OCR NER

Por: G Sudheer


Desarrollar un proyecto de aplicación de escáner de documentos que se extraiga de entidades nombradas a partir de documentos escaneados con OpenCV, Pytesseract, Spacy

Contenido del curso
11 secciones • 89 clases • 7 h 17 m de duración total
Idioma: INGLES

1. Introduccion
Introduccion - 03:48
Plan del Proyecto - 03:09
¿Tiene algún problema con el curso? Aquí está la solución - 06:03

2. Configuracion del Proyecto
Instalar Python - 02:23
Instalar entorno virtual - 02:03
Instalar paquetes en un entorno virtual - 01:39
Instalar Tesseract OCR y Pytesseract - 05:18
Instalar spaCy - 02:43
Prueba, los paquetes están instalados.- 03:17

3, Preparacion de datos
Cargue la tarjeta de presentación usando OpenCV y PIL - 06:15
Pytesseract: Error de Tesseract - 01:24
Pytesseract: imagen a texto a marco de datos - 08:06
Pytesseract: texto limpio en marco de datos - 04:14
Extraiga texto y datos de todas las tarjetas de presentación - 12:54
Guardar datos en csv - 01:41
Etiquetado - 06:21

4. Prepocesamiento y Limpieza de datos
Formato de datos de entrenamiento espacial - 01:46
Cargar datos y convertirlos en Pandas DataFrame - 05:58
Código actualizado -00:02
Texto de limpieza - 07:47
Convertir datos a formato espacioso - 06:33
Entidades de prueba - 01:23
Convierta datos a formato espacioso para todo el texto de tarjetas de presentación - 02:48
División de datos en conjuntos de entrenamiento y pruebas

5. Entrenar el modelo de reconocimiento
Espacioso: complete la configuración - 06:54
Espacioso: preparar datos - 08:32
Spacy: entrenar el modelo de tubería NER - 01:39
Spacy: Guardar modelo NER - 00:56

6. Predicciones
7. Mejorar el rendimineto del modelo
8. Escaner de Documentos
9. Aplicacion web de Escaner
10. Apendice


Descargar Curso

Exclusivo Miembros VIP

¿No tienes acceso? Adquiera la Membresia