sábado, 1 de mayo de 2010

PLN en la Empresa: Visionando los Próximos 10 Años


Web 1.0, Web 1.5, Web 2.0, Web 3.0, Web Semántica, Web Social... terminología que muestra que la evolución de la tecnología (principalmente la tecnología Web) ha sido vertiginosa en los últimos años, lo que ha provocado la aparición de nuevas necesidades y por lo tanto de nuevos modelos de negocio.


El Procesamiento del Lenguaje Natural engloba el conjunto de tecnologías necesarias para el entendimiento por parte de las computadoras del lenguaje humano.


¿Y para qué es necesario el PLN en la empresa? He aquí algunos ejemplos:


  • Análisis de Opinión en Blogs: Como una evolución de los métodos clásicos de investigación de mercado, el PLN puede aportar soluciones interesantes para conocer de manera automática qué están opinando los usuarios de nuestros servicios y productos, de los de nuestros competidores o analizar las tendencias del mercado y las nuevas necesidades que surgen.

  • Detección de Plagio: Plagiar, hablando de documentación textual, significa incluir en un documento fragmentos de texto escritos por alguna otra persona sin darle el crédito adecuado. Esta falta ha mostrado en los últimos años una explosión en el número de casos. La razón es sencilla: hoy en día tenemos acceso a un enorme repositorio de información entre páginas especializadas, bibliotecas digitales y enciclopedias digitales como Wikipedia. Pero esta variedad de fuentes hace excesivamente compleja la detección sin ayuda de procesos automáticos como los que se pueden obtener utilizando técnicas de PLN.

  • Sistemas de Recomendación: Todos conocemos las recomendaciones que nos hacen las librerías online sobre libros que otros autores también compraron, pero esto se basa exclusivamente en el aprendizaje automático de las preferencias de compra de un único producto (o incluso una cesta), lo que se corresponde con el aprendizaje de nuestro perfil basado en una única dimensión, la compra. ¿Pero qué sucede con las Redes Sociales? Las Redes Sociales incorporan tal cantidad de información acerca de nosotros que se podría crear un perfil tan ajustado como para recomendarnos cualquier cosa que pudiera ser de nuestro interés y no sólo en una dimesión sino en todas aquellas que conforman nuestro perfil. El PLN es necesario aquí para extraer, a diferencia de la compra que está totalmetne identificada, los datos más significativos de nuestro usuario para la construcción de su perfil y su posterior aprendizaje y comparación para la recomendación.

  • Etiquetado semántico (Generación de Web Semántica): La Web 3.0 ó Web Semántica, como evolución imparable de la gran cantidad de contenidos generados por los usuarios de la Web 2.0 y la Web Social, es la gran protagonista de la mayoría de conversaciones actuales en el mundo académico, profesional e incluso personal (pe. hobbies como las redes sociales de videojugadores), pero existe un grave problema para generar Web Semántica y es que aunque las herramientas existen, el etiquetado de contenidos no deja de ser un trabajo manual laborioso, tedioso, no exento de dificultades como la necesidad de ponerse de acuerdo en las etiquetas utilizadas y en el emparejamiento de los contenidos con una o más de estas etiquetas. Con las técnicas de Procesamiento de Lenguaje Natural se puede hacer una aproximación automática a este etiquetado de contenidos para generar así conocimiento útil y aplicable.

  • Búsqueda Documental (Búsqueda Semántica): Otra de las grandes protagonistas es la búsqueda documental, debido principalmente a que el uso intensivo de las tecnologías en el ámbito profesional (y también en el personal) deriva en la generación de grandes cantidades de información documental de difícil explotación y recuperación. Las técnicas de PLN permiten organizar y acceder, de manera similar al punto anterior, a toda esa documentación obviando ciertos problemas de la lengua como los errores ortográficos, las acronimias o la sinonimia, permitiendo una recuperación de información adecuada por ejemplo a consultas como "ayudas ayto. Jijón" devolviendo resultados para ayudas, subvenciones, becas y financiación relativas al ayuntamiento de Gijón.

  • Georeferenciación automática de contenidos:: Los GIS son una de las tecnologías de mayor auge en los últimos tiempos y ello debido a la importancia creciente que se le da a la localización sobre el territorio de prácticamente cualquier cosa. Como os expusimos en el trabajo GIRPharma, las técnicas de PLN permiten de manera automática georeferenciar contenidos textuales existentes en diversas fuentes, en el ejemplo, farmacias de guardia a partir de las diversas páginas Web que publican esta información. Pero yendo más allá y tomando como ejemplo el proyecto ArchaeoloGIS, podríamos georeferenciar en él todos aquellos contenidos existentes en la Web referentes a la ciudad de Valencia en las diferentes épocas históricas, ayudando de este modo a la inclusión de una información que de manera manual sería muy costosa.

Estos y muchos más serán los temas que podremos ver en el próximo WorkShop Procesamiento del Lenguaje Natural en Empresas: Visionando los Próximos 10 años que tendrá lugar en el marco de la SEPLN 2010 que este año se celebrará en Valencia los días 6 y 7 de septiembre.


¡¡¡Os esperamos a todos, INVESTIGADORES, EMPRESARIOS Y CURIOSOS EN GENERAL!!!

jueves, 15 de abril de 2010

Investigación en SIG


El departamento de investigación de Corex está de enhorabuena pues le han sido aceptados dos artículos en la "1st International Conference on Computing for Geospatial Research & Application" que tendrá lugar el próximo Junio en Washington DC

Los títulos de los trabajos son:


  • "ArchaeoloGIS: Using Geographic Information Systems to Support Archaeological Research", realizado conjuntamente con el investigador José Ferrandis de Forum Unesco-UPV

  • "GIRPharma: A Geographic Information Retrieval Approach to Locate Pharmacies on Duty", llevado a cabo conjuntamente con los investigadores Davide Buscaldi y Paolo Rosso del Laboratorio de Ingeniería Lingüística del DSIC-UPV

Próximamente serán publicados por ACM Digital Library.

¡Enhorabuena!

viernes, 9 de abril de 2010

GIRPharma: A Geographic Information Approach to Locate Farmacies on Duty

Este es el título del artículo que Corex irá a presentar a Washington DC el próximo junio al 1st. International Conference on Computing for Geospatial Research & Application


El trabajo describe una aproximación novedosa y multidisciplinar basada en recuperación de información geográfica (GIR) con el objetivo de dar solución al problema de búsqueda de farmacias de guardia en el territorio español.

El artículo se basa en trabajos de sus co-autores:


  • Francisco Manuel Rangel Pardo, Director I+D+i de Corex

  • María Dolores Rangel Pardo, Investigadora Lingüística de Corex

  • Davide Buscaldi, Investigador del Laboratorio de Investigación en Lenguaje Natural de la Universidad Politécnica de Valencia

  • Dr. Paolo Rosso, Director del Laboratorio de Investigación en Lenguaje Natural de la Universidad Politécnica de Valencia

Y que es el comienzo de una investigación mayor que abarca:


  • Crawling&Indexing: Proyecto de investigación para la creación de un robot inteligente y un datawarehouse que indexe la gran cantidad de información existente referente a las farmacias de España

  • Geographic Information Retrieval: Proyecto de investigación cuyo principal objetivo es la extracción de información geográfica existente en la Web eliminando en la medida de lo posible la ambigüedad existente. En esta línea nuestros colegas Davide y Paolo tienen gran experiencia, no olvidemos que son los creadores de GeoWordNet, proyecto reconocido por el proyecto WordNet

  • Geocoding: Últimamente existen numerosas noticias referentes a nuevas APIS de geocodificación, o mejor dicho georeferenciación, tales como la de Google, pero todas ellas no dejan de presentar ciertos problemas de ambigüedad como por ejemplo con los modismos y variaciones lingüísticas. Una tarea de investigación de este proyecto es la utilización de recursos como el mencionado GeoWordNet, bases de datos públicas como catastro, servicios de georeferenciación como Google, y todos aquellos recursos que puedan servir para obtener resultados superiores en calidad a los obtenidos individualmente por cada una de las herramientas

  • Cálculo óptimo de rutas: Estamos trabajando con diversos Institutos Tecnológicos de Valencia para la incorporación de sus soluciones de cálculo óptimo de rutas basadas en algoritmos genéticos, evolutivos y de hormigas en nuestros sistemas de tracking y visualización geográfica.

  • Visualización de la información geográfica: Una de las líneas principales de explotación de Corex, bajo el nombre Corex World, es la realización de visores ligeros para todo tipo de propósito a partir de tecnologías Open Source. De ahí nace su visor Where Is..? utilizado como sistema de tracking y que será presentado, si así nos lo aceptan, en la conferencia internacional FOSS4G: Open Source Geospatial Software que se celebrará el próximo septiembre en Barcelona. Pues bien, una de las mejoras al sistema Where Is...? en la que ya se está trabajando es en la utilización del sistema desde los dispositivos móviles, para lo cual también se está trabajando con diversos Institutos Tecnológicos

Estamos pues de enhorabuena ya que vamos a presentar nuestros trabajos en una de las conferencias internacionales de mayor prestigio en el ámbito de los Sistemas de Información Geográfica, y especialmente por la proposición de alguno de los revisores que ha solicitado expresamente que lo hagamos en una de las mayores salas habilitadas por el interés de la temática.

A continuación les dejamos el paper: GIRPharma: A Geographic Information Retrieval Approach to Locate Pharmacies on Duty (pendiente de revisión definitiva).

miércoles, 10 de marzo de 2010

ArchaeoloGIS: Using Geographic Information Systems to Support Archaeological Research




COM.GEO 2010, "1st. International Conference for Geospatial Research & Application", es el título del congreso internacional sobre Cloud-Computing en sistemas geospaciales que se celebrará el próximo junio en Washington al cuál Corex, con la participación de su director de investigación y desarrollo Francisco Manuel Rangel Pardo, junto con José Ferrandis Montesinos, investigador de arqueología del Forum UNESCO-UPV y Carlos Lamas López, responsable técnico de GIS en T-Systems , ha enviado un short paper sobre su proyecto "ArchaeoloGIS: Using Geographic Information Systems to Support Archaeological Research".

ArchaeoloGIS, próximamente publicado en http://archaeologis.corex.es, es un proyecto GIS de apoyo a la investigación arqueológica de José Ferrandis, quién está recopilando información referente a la evolución histórica de la Ciudad de Valencia usando como guía la construcción y evolución de las murallas de la misma, representando este conocimiento geográfico y temporal sobre una arquitectura GIS montada expresamente para darle soporte.

Ahora a esperar que lo publiquen, pero mientras tanto pueden descargárselo y estar al día de este tipo de aplicaciones que consideramos de sumo interés y utilidad.


viernes, 12 de febrero de 2010

Curso GIS Valencia: 2ª edición

Tras el éxito de la primera edición del Curso de Introducción al GIS celebrado en Valencia el pasado mes de Noviembre, Corex Soluciones Informáticas, S.L. organiza, con la colaboración de ACTIG, Centro de Soporte IDEC, Itaca, Mavir y Sugarcom, y con ponencias como el Doctor D. Jordi Guimet Pereña, Director del centro de soporte de la infraestructura IDEC, D. Pedro Sardinero Soto, Responsable de desarrollo de negocio en las AA.LL. de SIG en T-Systems Iberia, D. Carlos Lamas López, Responsable del departamento SIG de T-Systems Iberia y D. Francisco Manuel Rangel Pardo, Director I+D+I Corex Soluciones Informáticas, una segunda edición que contará con contenidos como:


  • Introducción al GIS

  • gvSIG

  • Infraestructura de Datos Espaciales

  • GIS en la Administración Pública

  • Tracking, sensorización y seguimiento de flotas

  • Herramientas de desarrollo

  • Cartografía matemática

  • Aplicaciones novedosas: Procesamiento de Lenguaje Natural(NLP), Sistemas de Preguntas/Respuestas (QA), Redes Sociales, Spatial DataMining...


Próximamente se harán públicas las fechas y precios, así como más información sobre sucesivos lanzamientos de cursos a lo largo de 2010:


  • GIS en la Administración Pública

  • Dirección de proyectos GIS

  • Programación de Servidores GIS

  • Programación de Clientes GIS


Dirigido a estudiantes y profesionales que necesiten ampliar sus conocimientos en SIG, se dispone de bolsa de prácticas en empresa para los alumnos que así lo soliciten, así como importantes descuentos en los cursos de especialización que aquí se introducen.

Ya está abierto el periodo de pre-inscripción a todos los cursos en la siguiente dirección:


http://world.corex.es/productos/world/curso_de_introduccion_al_gis_en_valencia.aspx

Para más información:

Teléfono de contacto: 902 014 004

eMail: corexworld@corex.es

Web: http://world.corex.es

domingo, 17 de enero de 2010

Homenaje al talento y la perseverancia


Léase como la introducción del "Alone in the dark" (para los que sean de la quinta...)

Sábado 17 de Enero de 2010, se prevé un largo y duro día de trabajo con el objetivo de reprogramar unos nuevos dispositivos de seguimiento de vehículos para que hagan todo tipo de tareas de autotesteo que luego comentaremos.

Son apenas las 8 de la mañana (en realidad las 12) cuando reunimos el trabajo realizado por nuestro primer homenajeado y merecedor de los créditos, Javier Pérez, quién se ha encargado de "destripar" las entrañas de los dispositivos (literalmente, a uno de ellos se le cae hasta la tarjeta) y de leerse las casi 1.000 páginas de los manuales del mismo, el conjunto de comandos AT permitidos y un manual de aprendizaje rápido de Java para dispositivos móviles (gran mérito contando que viene del mundo .Net).


La primera tarea es configurar todo el entorno de trabajo, lo que incluye configurar por un lado una máquina con puerto COM y puerto USB para la conexión del dispositivo:






Por otro lado, configurar un equipo con el entorno de desarrollo Java (Eclipse y todos los plugins necesarios para la programación del dispositivo):




Y por último configurar un entorno con el GIS de seguimiento y un cliente FTP para actualizar los cambios al servidor.

Tarea árdua y costosa que hace que las horas vayan pasando sin remedio. Decidimos hacer una parada a media tarde y efectuar unas pruebas. Damos una vuelta de 15 KM por la ciudad y comprobamos con el móvil en la dirección de Twitter dónde volcamos la ruta que todo funciona correctamente (http://twitter.com/corex_whereis) lo que nos da fuerzas para continuar. Bueno, eso y la gran cena que nos preparamos:




Pero comprendemos que todavía nos queda mucho trabajo que hacer y decidimos pedir ayuda (sábado por la noche, Valencia, fiesta, copas, chicas..., ¿nos querrán ayudar?):

- SMS Kico: Iván, cena friqui en mi casa, dispositivo, Javi y yo, necesitamos ayuda, te apuntas?
- SMS Iván: Tengo que llevar algo a parte de una botella de vino? Valencia o Alaquàs?

Dios nos cría y nosotros nos juntamos...


Iván Martínez, segundo homenajeado, el Maquiavelo de los ordenadores, se dedica a meterle el destornillador por todos los sitios imaginables a un servidor que no se quiere encender... Dios se apiade de él (del ordenador)




Algo más de las 3 de la madrugada, lo hemos conseguido, bueno, casi todo, aún no hemos conseguido programar el dispositivo en .Net, pero lo conseguiremos...

El dispositivo envía sus coordenadas a Where Is, y a Twitter, conecta con la API de Google y obtiene la dirección de policía para las coordenadas, responde a llamadas telefónicas, y a SMSs, es capaz de autochequearse, si le preguntas GPS te devuelve coordenadas, si le preguntas GPRS te devuelve el estado de conectividad, si le solicitas TEST te devuelve una serie de indicadores, y si le preguntas WHEREIS, te devuelve su dirección postal (casi, salvo un pequeño casque de Java que a estas horas no se nos ocurre...).

Cansados, exhaustos, pero felices, sólo hay que vernos las caras (sobre todo la de Iván, sea el cansancio, sea el sueño, sea el vino, le costaba mantener los ojos abiertos)...





Sábado por la noche, para unos noche de fiesta, para otros de trabajo duro, para nosotros, el placer del trabajo bien hecho y la buena compañía. Para Corex, el orgullo de contar con gente como esta.



TALENTO Y PERSEVERANCIA debe ser HOMENAJEADO.


lunes, 23 de noviembre de 2009

Éxito 1ª edición Curso GIS

El pasado sábado día 21 cerramos la primera edición del curso de Introducción al GIS que trajo consigo profesionales de la talla del Dr. Jordi Guimet, Director del Centro de Soporte a la Infraestructura de Datos Espaciales de Cataluña.

El curso se ha realizado en las salas del hotel Abashiri y ha tenido una afluencia satisfactoria de alumnos, especialmente por su diversidad y por el interés que han demostrado.

El curso comenzó el viernes 13 con una breve introducción teórico/histórica a los GIS efectuada por D. Carlos Lamas, Responsable del Departamento SIG de T-Systems Iberia, seguida de una introducción práctica a gvSIG que duró hasta finalizar la sesión del sábado 14. Por su conocimiento de la herramienta, pero sobre todo por su perspectiva cultivada durante más de 20 años en la aplicación de los SIG en diferentes ámbitos de la administración pública y la empresa privada, dio una visión diferenciada de los sistemas GIS y su uso frente a lo que los mismos alumnos ya conocían.



La sesión del viernes 20 se abrió con el Dr. Jordi Guimet con una clase MAGISTRAL de lo que es una IDE. Con sus más de 7 años de experiencia en el desarrollo y soporte de una de las IDEs más importantes a nivel mundial (esperamos en breve poder anunciar su nombramiento oficial como la mejor IDE mundial, de momento está entre los finalistas), y su larga trayectoria profesional y docente en GIS, el Dr. Guimet nos asombró a todos con su exposición, clara, concisa, y con elementos prácticos complementarios que nos hicieron comprender, entender y aprender lo que es una IDE, lo que es una IDE Local y lo que aunque muchos autores lo quieran, no es ni lo uno ni lo otro.

La sesión del viernes 20 se terminó por D. Francisco Rangel con un repaso a los sistemas de tracking, sus fundamentos, dispositivos y los aspectos más avanzados de la investigación puntera en algoritmos genéticos, algoritmos de hormigas o búsquedas tabú para la planificación y optimización de rutas y flotas llevados a cabo en centros de investigación como el Instituto Tecnológico de Informática (ITI).







La sesión del sábado 21 tuvo la lamentable baja de nuestro amigo D. Pedro Sardinero que por motivos de una fuerte neumonía no puedo dar su sesión sobre administraciones públicas, y que fue sustituida por tres charlas de D. Francisco Rangel sobre herramientas de desarrollo, cartografía matemática y aplicaciones futuras de los GIS y la investigación más puntera en redes sociales, spatial datamining y natural language processing, que fue complementada por un extraordinario investigador pre-doctoral de la UPV, D. Davide Buscaldi, uno de los creadores de geoWordNet y alumno de un invitado de honor, nuestro amigo el Dr. Paolo Rosso, Director del Natural Language Engineering Lab (y que por cierto nos invitó a su master a hablar de temas relacionados con las redes sociales), quien habló de los sistemas de Q/A aplicados al GIS, y mostró su sistema Geooreka! basado en técnicas avanzadas de Procesamiento de Lenguaje Natural.

Pero lo mejor de todo, nuestros alumnos, gracias a ellos ha sido posible la realización de este curso y gracias al interés mostrado retomamos fuerzas para en breve continuar con nuestra labor formativa lanzando nuevos cursos de introducción y alguno de especialización que ya se está perfilando.

¡Gracias a todos!