La imperiosa necesidad de aprendizaje automático en el sector público



Estamos emocionados de traer de vuelta Remodel 2022 en persona el 19 de julio y virtualmente del 20 al 28 de julio. Únase a los líderes de inteligencia synthetic y datos para charlas perspicaces y oportunidades emocionantes para establecer contactos. Regístrese hoy!


La gran cantidad de retrasos y retrasos en el sector público es inquietante para una industria diseñada para servir a los electores. El verano pasado fue noticia el cuatro meses período de espera para recibir pasaportes, sustancialmente superior a la norma previa a la pandemia de 6 a 8 semanas de tiempo de respuesta. Más recientemente, el Servicio de Impuestos Internos (IRS, por sus siglas en inglés) anunció que ingresó a la temporada de impuestos de 2022 con 15 equipos la cantidad recurring de atrasos en la presentación, junto con su plan para seguir adelante.

Estos retrasos publicitados con frecuencia no existen debido a la falta de esfuerzo. El sector ha avanzado a pasos agigantados con los avances tecnológicos en la última década. Sin embargo, la tecnología heredada y los procesos obsoletos aún afectan a algunos de los departamentos más destacados de nuestra nación. Las agencias de hoy deben adoptar transformación digital esfuerzos diseñados para reducir la acumulación de datos, mejorar los tiempos de respuesta de los ciudadanos e impulsar mejores resultados de la agencia.

al abrazar aprendizaje automático (ML) soluciones y agregando avances en procesamiento pure del lenguaje (NLP), los retrasos pueden ser cosa del pasado.

Cómo ML y AI pueden unir los mundos físico y digital

Ya sean documentos fiscales o solicitudes de pasaporte, el procesamiento guide de artículos lleva tiempo y es propenso a errores en los lados de envío y recepción. Por ejemplo, un remitente puede marcar por error una casilla incorrecta o el receptor puede interpretar el número «5» como la letra «S». Esto crea retrasos de procesamiento imprevistos o, peor aún, resultados inexactos.

Pero gestionar el creciente problema de acumulación de datos y documentos del gobierno no es tan easy y limpio como cargar información a los sistemas de procesamiento. La gran cantidad de documentos e información de los ciudadanos que ingresan a las agencias en una variedad datos no estructurados formatos y estados, a menudo con poca legibilidad, hacen que sea casi imposible extraer datos de manera confiable y eficiente para la toma de decisiones posteriores.

Adoptar la inteligencia synthetic (IA) y el aprendizaje automático en las operaciones gubernamentales diarias, tal como lo han hecho otras industrias en los últimos años, puede proporcionar la inteligencia, la agilidad y la ventaja necesarias para optimizar los procesos y permitir la automatización integral de los procesos centrados en documentos.

Las agencias gubernamentales deben comprender que el cambio actual y el éxito duradero no vendrán con parches rápidos construidos sobre el reconocimiento óptico de caracteres (OCR) heredado o soluciones de automatización alternativas, dada la gran cantidad de datos entrantes.

Se puede lograr un puente entre los mundos físico y digital con el procesamiento inteligente de documentos (IDP), que aprovecha los modelos patentados de ML y la inteligencia humana para clasificar y convertir formatos de documentos complejos y legibles por humanos. Los archivos PDF, las imágenes, los correos electrónicos y los formularios escaneados se pueden convertir en información estructurada y legible por máquina mediante IDP. Lo hace con mayor precisión y eficiencia que las alternativas heredadas o los enfoques manuales.

En el caso del IRS, inundado con millones de documentos como formularios 1099 y formularios W-2 de individuos, modelos sofisticados de ML e IDP pueden identificar automáticamente el documento digitalizado, extraer texto impreso y escrito a mano y estructurarlo en un formato legible por máquina. . Este enfoque automatizado acelera los tiempos de procesamiento, incorpora apoyo humano cuando es necesario y es muy eficaz y preciso.

Avanzando en los esfuerzos de ML con NLP

Junto con la automatización y el IDP, la introducción de tecnologías ML y NLP puede respaldar significativamente la búsqueda del sector para mejorar los procesos y reducir los retrasos. La PNL es un área de la informática que procesa y comprende texto y palabras habladas como lo hacen los humanos, tradicionalmente basada en la lingüística computacional, la estadística y la ciencia de datos.

El campo ha experimentado avances significativos, como la introducción de modelos de lenguaje complejos que contienen más de 100 mil millones de parámetros. Estos modelos podrían potenciar muchas tareas complejas de procesamiento de texto, como la clasificación, el reconocimiento de voz y la traducción automática. Estos avances podrían respaldar una extracción de datos aún mayor en un mundo invadido por documentos.

De cara al futuro, la PNL está en camino de alcanzar el nivel de capacidad de texto comparable al de un trabajador del conocimiento humano, gracias a los avances tecnológicos impulsados ​​por el aprendizaje profundo. Avances similares en el aprendizaje profundo también permiten que la computadora comprenda y procese otro contenido legible por humanos, como imágenes.

Específicamente para el sector público, esto podría ser imágenes incluidas en reclamos por discapacidad u otros formularios o solicitudes que consisten en algo más que texto. Estos avances también podrían mejorar las etapas posteriores de los procesos del sector público, como la toma de decisiones impulsada por ML para determinar la asistencia por desempleo, el seguro de Medicaid y otros servicios gubernamentales invaluables.

No modernizarse ya no es una opción

Aunque hemos visto un puñado de mejoras prometedoras en la transformación digital, el llamado a un cambio sistémico aún no se ha respondido por completo.

Para avanzar hoy en día, es necesario asegurarse de que las agencias vayan más allá de parchear e invertir en varios sistemas heredados. Los mosaicos y las inversiones en procesos obsoletos no son compatibles con nuevos casos de uso, son frágiles a los cambios y no pueden manejar aumentos repentinos de volumen. En cambio, la introducción de una solución versatile que puede tomar los documentos más complejos y difíciles de leer desde la entrada hasta el resultado debería ser una obviedad.

¿Por qué? Los ciudadanos merecen más de las agencias que los atienden.

CF Su es vicepresidente de aprendizaje automático en Hyperscience.

Tomadores de decisiones de datos

¡Bienvenido a la comunidad VentureBeat!

DataDecisionMakers es donde los expertos, incluidos los técnicos que trabajan con datos, pueden compartir información e innovación relacionadas con los datos.

Si desea leer sobre concepts de vanguardia e información actualizada, mejores prácticas y el futuro de los datos y la tecnología de datos, únase a nosotros en DataDecisionMakers.

Incluso podrías considerar contribuyendo con un artículo ¡tuyo!

Leer más de DataDecisionMakers