Blog post escrito por Sofía Ormazábal, voluntaria de Girls in Tech.
Nos vemos rodeados de más y más información cada día. Sin embargo, no necesariamente contamos con las herramientas para procesar y analizar estos datos. Es por esto que las áreas con mayor crecimiento durante los últimos años en las Ciencias de la Computación han sido las de “Data Science” y “Machine learning”. Data Science refiere a la disciplina que estudia cómo procesar y trabajar con grandes cantidades de datos de manera eficiente y analizarlos con modelos estadísticos, con el fin de extraer conocimiento útil para otras áreas como la economía, psicología y astronomía, por mencionar algunas. Machine Learning ( aprendizaje de máquinas) es un término usado para describir el proceso mediante el cuál un programa computacional puede “aprender” patrones a través del análisis de una muestra de datos y luego predecir futuros datos en base a estos patrones. Un ejemplo sencillo sería el “autocorrector” de los teléfonos, que sugiere lo que vamos a escribir a continuación, basado en nuestra frecuencia de uso y combinaciones previas de palabras.
Desafortunadamente, Machine Learning y Data Science son dos de las áreas de la Ciencia de la Computación con menor participación femenina. Sin embargo, para contrarrestar esta situación se creó la organización “Women in Machine Learning”, que organiza conferencias anuales para dar a conocer los trabajos más relevantes de las investigadoras en estos campos. Pese a la falta de mujeres que investigan en estas áreas, hay numerosas investigadoras que se destacan por sus avances en Machine Learning, procesamiento de datos y aplicaciones a otros ámbitos tales como la medicina, genética, traducción o economía.
Una de las investigadoras más eminentes en Machine Learning es Daphne Keller, profesora de Stanford, quien se especializa en el uso de modelos probabilísticos para atacar fenómenos complejos y con altos niveles de incertidumbre. Su investigación radica en perfeccionar modelos de representación, inferencia, aprendizaje y toma de decisiones para afrontar problemas como la detección de cáncer o anomalías genéticas, usando grandes bases de datos como punto de partida para “alimentar” el aprendizaje de los programas computacionales encargados del análisis.
Además, ha diseñado algoritmos para visión artificial (hacer que un computador pueda recibir imágenes como input y transformarlas a una forma de datos con los que el computador pueda trabajar), y modelos útiles para investigación en biología y medicina. En específico, ha trabajado en modelos de detección y predicción de cáncer de mamas y de análisis de genoma.
Junto a ella ha trabajado otra importante investigadora, Lise Getoor. Lise se ha destacado por sus avances en el campo de “Big Data”. Su trabajo consiste en diseñar modelos para analizar bases de datos gigantes y poder representar estos datos de una forma más visual y simple para trabajar. Al vivir en un mundo en que estamos rodeados de información, desordenada y llena de ruido, el trabajo de Lise resulta crucial para permitir avances en economía, medicina o astronomía, por mencionar algunas disciplinas. Lise afirma que su principal meta es que los datos no sean una parte más del problema, sino que estén a favor de los investigadores y entreguen información útil y clara para llegar a las conclusiones buscadas.
Como vemos, es necesario que cada vez más mujeres se incorporen al mundo del análisis y procesamiento de datos, ya que este trabajo es una herramienta fundamental para el avance tecnológico y científico en el mundo.
Para aprender más sobre el trabajo de Lise, adjunto una charla sobre la importancia y los desafíos de trabajar con “Big Data”.