Francisco Herrera, catedrático de Ciencia de la Computación e Inteligencia Artificial en la Universidad de Granada, recibió recientemente el IV Premio Cajastur «Mamdani» de soft computing.
-Un premio por sus trabajos en la llamada lógica difusa.
-Me lo han dado por los resultados obtenidos en sistemas difusos evolutivos. Por la hibridación de la lógica difusa con técnicas de algoritmos genéticos. La unión de ambas perspectivas da capacidad de aprendizaje a los sistemas difusos evolutivos.
-¿Capacidad de aprendizaje?
-Sí, permite dar capacidad de aprendizaje a los sistemas difusos de manera que hay información representada con palabras, con reglas lingüísticas, modelando el razonamiento humano. La base son los datos logrados a partir de algoritmos genéticos.
-¿Estamos hablando de algo así como el ordenador «Hall» de aquella «Odisea del espacio»?
-Estamos hablando de lograr que los sistemas inteligentes razonen de la misma forma que lo hacemos los humanos. Se trata de que representen la información en términos lingüísticos.
-¿Cómo?
-Los humanos hablamos, por ejemplo, del confort alto o medio o bajo de un coche. Manejamos conceptos que se refieren a mucho, a poco o a nada valorado. No utilizamos números. Todos entendemos que muy alto es más que alto y que en una escala de cero a diez muy alto estaría cercano al 9, el nivel excelente correspondería al 10 y el medio al 5. Pero se habla con formas lingüísticas. Ése es el objeto de la lógica difusa del profesor Zade, representar el conocimiento en términos lingüísticos para simular el conocimiento humano.
-Así que hacen de la imprecisión una ventaja.
-Una imprecisión muy precisa, se podría decir, porque debajo de esas etiquetas lingüísticas el ordenador representa el conocimiento como lo hace un humano. Nadie requiere que un experto diga que el confort de determinado vehículo es 0,23. Basta que indique que es elevado, o medio, o lo que sea. Frente a otro coche menos valorado en los mismos términos, preferimos el primero y en paz. Sin necesidad de utilizar valores numéricos entendemos el mensaje. En el caso de la lógica difusa la representación lingüística tiene por debajo una representación matemática, la teoría de conjuntos difusos, que permite precisar qué significa en un problema concreto un concepto lingüístico.
-¿No se complica todo con problemas idiomáticos o culturales?
-Los problemas están en relación con el contexto. En una población de estatura digamos que normal un hombre de 1,95 es muy alto y es bajo si mide 1,60. Pero entre gente del baloncesto muy alto es solo un pívot de 2,10. Cuando cambia el contexto, puede cambiar la representación matemática que hay debajo de la etiqueta lingüística. Es importante contextualizar el problema y representarlo de acuerdo con el concepto correcto. Luis Magdalena, director del European Centre for Solft Computing de Mieres, trabajó en eso, en la forma de contextualizar la representación matemática. Con los algoritmos genéticos aprendemos y ajustamos el contexto matemático en función del problema. Movemos la etiqueta, el conjunto difuso, para contextualizar y tener unas salidas precisas. Damos soluciones precisas a partir de una información imprecisa.
-¿De qué forma trabaja?
-El trabajo lo desarrollo en equipo. Comienzo trabajando con papel y lápiz. Siempre se empieza así. Imaginas la solución a la que quieres llegar. Sueltas unas pinceladas con papel y lápiz y empiezas a formalizar ese núcleo inicial. Cuando crees tener los pasos dados en el papel y también mentalmente, pasas a la fase de implementación. Tengo un equipo extenso, yo trabajo en la parte del diseño, la discuto con los senior del equipo y los jóvenes son los encargados de implementar la idea, de darle vida al algoritmo en el ordenador. Después, claro, analizamos los resultados.
-¿Hacen un programa?
-Acaba siendo un programa en el ordenador. Trabajamos sobre un conjunto de bases de datos que nos sirven para ver si la idea funciona. Analizamos los resultados, se perfilan y se dan los retoques.
-¿Utilizan ordenadores y sistemas operativos convencionales?
-La computación lingüística tiene siempre una representación formal matemática por debajo. La implementamos en un lenguaje de programación estándar como puede ser Java.
-¿Siempre con un fin preciso?
-Siempre estamos pensando en aplicaciones concretas. Siempre trabajamos con un problema concreto. A veces nos enfrentamos con un modelo más teórico, dicho sea entre comillas, con escenarios genéricos del ámbito científico y otras veces con cosas concretas.
-Por ejemplo…
-Con datos en los procesos de concesión de préstamos bancarios sean hipotecarios o de consumo. Trabajamos con Caja Granada y con Caja Navarra. Nos han planteado problemas centrados en la forma de encontrar patrones de comportamiento de los usuarios.
-¿Para qué?
-Se trataba inicialmente de analizar la calidad de los datos de entrada en el proceso de concesión de préstamos. Y a partir de ahí hemos ido aplicando el descubrimiento de grupos, de grupos de patrones con un comportamiento similar, para inferir decisiones y conclusiones. Investigamos con algoritmos y los adaptamos a los datos bancarios.
-¿Con qué objeto?
-Lo que interesa es analizar los patrones de comportamiento de los datos para las solicitudes de préstamos. Buscamos un sistema que le sirva al banco para la toma de decisiones a la hora de evaluar riesgos. Si los datos de entrada pidiendo un crédito son etiquetados como de bajo riesgo, se procesan rápido y sin complicaciones. Pero puede aparecer un problema de calidad de datos y eso da una incongruencia.
-¿En qué sentido?
-Pueden darse errores. Los datos se introducen, por ejemplo, según los ingresos. Y ahí cabe que se produzca un error de manera que un administrativo de bajo nivel salarial, que gane mil euros al mes, por una equivocación aparezca como que gana 12.000 euros. Un error humano que una máquina no aprecia. Pues bien, nosotros analizamos el comportamiento del subgrupo de administrativos de bajo nivel salarial y, ante un dato discorde, se dispara una alarma. De lo contrario entrarían los datos automáticamente en el banco sin ningún filtro.
-¿Etiquetan a los clientes por números o por términos como fiables, premorosos y demás?
-Bien con etiquetas correspondientes a niveles de riesgo o considerando etiquetas potencialmente incorrectas. Salvo excepciones, un administrativo poco cualificado no gana más de 3.000 euros al mes; de manera que si entra ese dato, debe saltar una alarma.
-Explique qué es la minería de datos en la que es experto.
-Es un campo del saber que trata de extraer conocimiento útil a partir de bases de datos que contienen determinada información. No es algo en absoluto trivial como pudiera parecer si se mira superficialmente. Las bases de datos de préstamos de un banco, por seguir con el mismo tema, están formadas por columnas de datos en una tabla. Tratamos de sacar un concepto implícito dentro de esa base de datos y que sea útil al usuario. A un banco se le informa de que a partir de su tabla de datos entre la entrada «administrativo» y la entrada «salario» puede haber un cierto margen de error, un cierto porcentaje de equivocación, que se logra detectar si los parámetros divergen. De esa forma le estoy dando al banco un conocimiento útil. El sistema inteligente se pone en el filtrado de información del banco y al profesional encargado de los préstamos le salta una alerta indicando que la información es correcta ya que es coherente o no es correcta.
-Usted es asimismo Premio Nacional de Informática.
-Sí, lo concede la Federación de Asociaciones Informáticas por los trabajos de soft computing y por las actividades de minería de datos. Es un premio a una carrera, he dirigido 22 tesis doctorales desde 1996 en que se leyeron las dos primeras. Por el contrario, este premio de Cajastur es por un hito concreto, relativo a las aplicaciones bancarias.
-Los expertos de Bolsa hablan de infraponderar o sobreponderar, quizás en la línea de la lógica difusa.
-Hay sistemas de lógica difusa aplicados a la Bolsa e investigadores en predicción con esas herramientas. En general, son modelos de clasificación, de predicción y de asociación de conocimientos.
-¿Qué opina del proceso universitario de Bolonia?
-Hay que distinguir dos cosas: por una parte, con el plan de Bolonia se pretende que un estudiante se pueda mover. Se busca que pueda hacer el grado en una Universidad, el máster en otra y la tesis en una tercera. Y en diferentes países. Eso es muy positivo, no hay ninguna duda. Cada cual puede elegir y buscar la oferta que más le interese. Como referencia habrá una etiqueta de calidad en cada Universidad y en función de las distintas especialidades. Los títulos se reconocen en todos los sitios.
-Pero…
-Lo cuestionable o problemático es el modelo de enseñanza que se propone. Hay que trabajar con grupos pequeños y según una enseñanza personalizada. Eso requiere muchas horas de profesor por estudiante. Y necesita de unos medios muy superiores a los actuales en profesorado. También exige la adecuación de los espacios. Las aulas actuales, con frecuencia, están diseñadas para 150 estudiantes o más. Ahora, con Bolonia, harán falta muchas más aulas o espacios y más reducidas. Se piensa en seminarios de 15 personas y en reuniones continuas. Para desarrollar ese nuevo concepto hay que invertir en infraestructuras y, al reducir los grupos, hacen falta más profesores. Todo eso tiene evidentes repercusiones económicas.
-¿Como ve el European Centre for Soft Computing de Mieres?
-En cinco años ha alcanzado nivel internacional, está en la primera línea. Cuenta con investigadores de un alto reconocimiento científico en todas las escalas y con una forma de trabajar flexible, que es lo que se estila en Europa pero aún no, desgraciadamente, en España. Los contratos de los investigadores son por un tiempo concreto y para una tarea determinada. Al margen está su carrera profesional. Ése es el modelo de los países avanzados como Francia y Alemania. Y en cinco años se ha logrado que el centro de Mieres sea un referente internacional. En abril Oscar Cordón, un investigador de Mieres, recogerá el premio internacional al mejor investigador joven en desarrollo de aplicaciones. Es el premio al mejor del mundo. Da idea del alto nivel del centro.
-¿Siempre se vio como un matemático dedicado a la informática?
-Nací en Jódar, Jaén, junto al Guadalquivir. Estudié matemáticas en la Universidad de Granada. Pensaba ser profesor de instituto. En los últimos años de la carrera seguí una especialidad con perfil informático. Pensé en hacer el doctorado para irme a una empresa privada. Salieron unas plazas en el departamento y eso cambió mi orientación profesional porque me quedé en la Universidad. La investigación ocupa el 90 por ciento de mi trabajo.
Descargar