Análisis de texto | 2018

Análisis de texto | 2018

Descripción

El curso se inicia planteando el análisis cuantitativo de texto en contexto y mostrando sus conexiones con otros métodos cualitativos y cuantitativos de investigación en ciencias sociales. También introduce las nociones matemáticas clave que guían los modelos de análisis de texto y presenta un recorrido a través de las formas más comunes de análisis de texto en ciencias sociales (por ej. análisis manual de contenidos).

Luego de una revisión crítica del análisis manual de contenidos, se consideran algunos desarrollos metodológicos recientes, como el análisis semi-automatizado, el análisis basado en diccionario y los modelos estadísticos asociados a tópicos. Se muestra como construir estos modelos para cuantificar el contenido de discursos políticos, manifiestos, materiales legales, etc. Posteriormente el curso se centra en el problema de la asignación de grandes cantidades de documentos a categorías (por ejemplo, determinar agendas de medios asignando muchos años de noticias de periódicos en diferentes categorías). Los estudiantes podrán aprender a determinar la precisión y la exactitud de la categorización semi-automatizada y a considerar el grado en que las categorías pueden ser determinadas en forma inductiva a partir de un texto en crudo. La sección sobre modelos para análisis de texto finaliza con una mirada sobre la aplicación de escalas, recorriendo modelos de escala de texto y mostrando como pueden ser entendidos como modelos sustantivos de toma de posición a través del lenguaje, (por ej, en debates políticos o contenido legislativo, o como métodos compactos y efectivos para visualizar distintos tipos de datos, desde resultados de análisis de contenido al contenido de múltiples documentos.

El curso también ofrece soluciones prácticas a problemas que emergen de la adquisición, pre-procesamiento y almacenamiento de granes cantidades de textos, por ej, textos provenientes de sitios web de organismos gubernamentales o no gubernamentales. Estos tópicos, frecuentemente descritos como 'spidering' y 'scraping' de datos, estarán directamente asociados a los intereses de investigación de los estudiantes. Dependiendo de estos intereses, también se podrán explorar asuntos asociados a materiales en otras lenguas distintas del inglés, así como scripts, segmentación de palabras, etc.  El curso concluye con una discusión explícita sobre distintos diseños de investigación y cómo estos se adecuan al análisis de texto, con especial énfasis en como las medidas de texto pueden ser interpretadas en el marco de los intereses de los estudiantes.

Ver programa


Objetivos

El curso ofrece una mirada panorámica sobre los métodos cuantitativos y técnicas informáticas para la adquisición, medición y modelización de texto como datos. Recorre los modelos más importantes para el en análisis de contenido de texto – entre ellos, modelos manuales de análisis basados en diccionarios, clasificación automática de documentos, y abordajes de escala- dentro de un marco de medición unificado que clarifica los diferentes supuestos que subyacen a cada modelo. El curso provee a los participantes de ejercicios en el ajuste, interpretación y crítica de cada tipo de modelo utilizando información real y soluciones prácticas al problema de la generación y almacenamiento eficiencia de datos provenientes de fuentes de acceso público.


Prerrequisitos

El curso no tiene pre-requisitos formales. Sin embargo, es deseable que los estudiantes cuenten con alguna experiencia previa en el manejo del software R y que estén familiarizados con conceptos estadísticos básicos.


Bibliografía

Krippendorff, Klaus H. 2013. Content Analysis: An Introduction to Its Methodology. 3rd edition. Thousand Oaks, CA: Sage Publications.
Neuendorf, Kimberly A. 2002. The Content Analysis Guidebook. Thousand Oaks, CA: Sage Publications.


 

Instructor

Iñaki Sagarzazu
Profesor Asistente de Ciencia Política
Texas Tech University
inaki.sagarzazu@ttu.edu
www.inaki-sagarzazu.com/




Iñaki Sagarzazu es Profesor Asistente de Ciencia Política en la Universidad Texas Tech. Estudió en la Universidad Simón Bolívar así como en la Universidad of Houston, donde también obtuvo su doctorado. Previo a asumir su actual posición en Texas Tech University, se desempeñó en la Universidad de Glasgow y el  Nuffield Center for Experimental Social Sciences de la Universidad de Oxford. Sus intereses de investigación se centran en política comparada y métodos cualitativos, con especial énfasis en análisis estadístico de contenido con aplicaciones a la comunicación política e instituciones.  Ha publicado en revistas como Political Behavior, European Union Politics, and Electoral Studies. Además de enseñar matemáticas, programación, y estadística multivariada en la Universidad de Houston, también ha dictado cursos sobre análisis de texto y modelos multinivel en el Institute of International Relations, la ECPR Winter School in Methods and Techniques en la Universidad de Bamberg, y en la IPSA Summer School en la  Universidad de São Paulo.