Minero de datos: Anthony Goldbloom creó Kaggle para convertir el análisis de datos en un deporte de competición, conectando a las empresas que tienen montones de datos con personas que pueden ayudarlas a sacarles algún valor.
Fuente: Kaggle

Informática

El análisis de datos como disciplina deportiva

Kaggle organiza concursos para organizaciones que desean conseguir predicciones fiables partiendo de montañas de datos.

  • Martes, 7 de febrero de 2012
  • Por Rachel Metz
  • Traducido por Lía Moya (Opinno)

Hay cosas, Como la niebla en San Francisco o los atascos en la ciudad de Nueva York, que son fáciles de predecir. Otras, como la reacción de la bolsa ante los grandes valores o la progresión de la enfermedad de un paciente de VIH, son mucho más complejas.  Ahí es donde entra en escena una start-up llamada Kaggle. Organiza concursos en los que los participantes intentan hacer predicciones aparentemente imposibles mediante el análisis de montañas de datos.

Kaggle reúne a miles de personas con experiencia en el análisis de datos, incluyendo doctores, estudiantes, profesores y personas que trabajan en empresas como IBM y Google, y les ofrece la posibilidad de competir para resolver las interrogantes que presentan los grandes datos de las empresas a cambio de dinero. Los usuarios cogen los datos proporcionados por los promotores del concurso y compiten usando algoritmos hechos a medida para hallar patrones y presentar las predicciones más exactas. Se podría definir como una competición  a muerte de modelos de predicción.

Fundada por el economista australiano Anthony Goldbloom, la inspiración para crear Kaggle proviene en parte de un concurso convocado por Netflix entre 2006 y 2009. La empresa de alquiler de películas ofrecía un millón de dólares al equipo que fuera capaz de mejorar la precisión de su software de recomendación de títulos en un 10 por ciento.

La popularidad del concurso de Netflix reveló a Goldbloom la cantidad de gente interesada en trabajar interpretando y analizando los datos de las empresas. Su estancia en prácticas en The Economist en 2008 puso delante a montones de empresas con datos analizables para sacar conclusiones valiosas, pero sin la gente adecuada para estudiarlos.

Apostó por que había sitio para una empresa que uniera a estas dos partes y decidió que conseguiría mejores resultados si tuviera un toque competitivo.

Y tenía razón. Desde su lanzamiento en abril de 2010 con un premio de 1.000 dólares (unos 775 euros) para el equipo que hiciera una predicción más precisa de cómo votarían los países en el concurso de la canción de Eurovisión, Kaggle ha llevado a cabo 30 concursos distintos, cinco de los cuales aún están en marcha.

Y la comunidad de Kaggle, que ha crecido hasta estar formada por unas 27.000 personas, obtiene resultados. En uno de los primeros retos, un académico de la Universidad de Drexel (EE.UU.) puso a disposición de los concursantes historiales médicos anónimos de pacientes con VIH que contenían datos de marcadores genéticos que él esperaba se pudieran usar para predecir la progresión del virus. En semana y media los usuarios de Kaggle fueron capaces de predecir la progresión con una precisión del 70 por ciento al comparar sus predicciones con datos conocidos de una investigación académica que supuso un hito y que se logró tras cuatro años de trabajo. Para el final de la competición, que duraba tres meses, los usuarios del sitio habían creado un modelo que reducía la tasa de error anterior en un tercio y aumentaba la precisión de las predicciones al 77 por ciento.

Para comentar, por favor accede a tu cuenta o regístrate

¿Olvidaste tu contraseña?

Informes Especiales

El futuro de la medicina: un tratamiento para cada paciente

Una ola de avances científicos e inversiones financieras puede estar a punto de marcar el nacimiento de una nueva era de atención sanitaria marcada por la personalización y la precisión. Bienvenidos al futuro de la medicina.

Otros Informes Especiales

Advertisement
Advertisement
Publicidad