Cualificaciones a buscar en un Ingeniero de Procesamiento de Lenguaje Natural
Un Ingeniero de Procesamiento de Lenguaje Natural (PLN) desarrolla productos que procesan el lenguaje humano mediante una computadora.
Tu próximo candidato ideal debe dominar campos relacionados como el aprendizaje automático, la minería de texto, la teoría de la información y la recuperación de información.
Busca candidatos con experiencia en proyectos que trabajen con datos de lenguaje natural como IBM Watson Tone Analyzer, NLTK (Python), Apache OpenNLP o GATE. Algunas de tus mentes más brillantes en el campo también tendrán conocimientos de lingüística y/o fluidez en uno o más idiomas extranjeros.
La informática es la formación más relevante para este puesto, pero algunos de los mejores reclutas pueden tener una formación en lingüística que enfatice la lingüística computacional.
Consejo clave: Contrata candidatos dispuestos a crecer asegurándote de que sus objetivos profesionales personales se alineen con la misión de tu empresa.
Preguntas de entrevista sobre Procesamiento de Lenguaje Natural
Preguntas sobre procesamiento de lenguaje natural
- Necesitamos que construyas un sistema que agrupe automáticamente artículos de noticias por tema. Explícame el proceso.
- ¿Cómo entrenarías un modelo que identifique si la palabra “Amazon” en una oración se refiere a la región o a la empresa?
- Necesitamos que diseñes un modelo para predecir si la reseña de una película fue positiva o negativa. ¿Cuál es tu proceso?
- Explica para qué se utiliza el etiquetado de partes de la oración (POS). ¿Cuál es el enfoque más simple que puedes imaginar para construir un etiquetador POS?
- Necesitas construir un etiquetador POS desde cero, dado un corpus de oraciones anotadas. ¿Cómo abordarías esto? ¿Cómo manejarías las palabras desconocidas?
- Necesitas encontrar todas las ocurrencias de texto citado en un artículo de noticias. ¿Cómo abordarías esto?
- Necesitamos que construyas un sistema que autocorrige el texto generado por un sistema de reconocimiento de voz. Explícame cómo lo harías.
- Explica la indexación semántica latente. ¿Dónde se puede aplicar?
- ¿Cómo construirías un sistema para traducir texto del inglés al español? ¿Cómo revertirías la traducción?
- Explica qué son las palabras vacías (stop words). ¿Cuándo deberías eliminar las palabras vacías en una aplicación?
Preguntas sobre teoría de la información, lingüística y recuperación de información
- ¿Qué aspectos necesitarías resolver al construir y usar un corpus de texto anotado como el Corpus Brown?
- Define la entropía. ¿Cómo estimarías la entropía del idioma español?
- Explica la gramática regular. ¿Difiere esta en poder de una expresión regular y, si es así, ¿de qué manera?
- Define la puntuación TF-IDF de una palabra. ¿Cuándo es útil esto?
- Explica cómo funciona el algoritmo PageRank.
- Define el análisis de dependencias.
Preguntas sobre herramientas e idiomas
- ¿Dominas algún idioma extranjero?
- Explica cualquier herramienta para entrenar modelos de PNL (Apache OpenNLP, NLTK, GATE, MALLET, etc.) que hayas utilizado.
- ¿Cuál es tu experiencia en la construcción de ontologías?
- Explica WordNet u otros recursos lingüísticos relacionados que hayas utilizado.
Empieza a optimizar tu proceso de reclutamiento hoy mismo.
Empieza a optimizar tu proceso de reclutamiento hoy mismo.

