|
|
 |
| |
|
Algoritmo para la asignación
de coordenadas en campos textuales de bases de datos
Pablo Palacios:
pablopal@unal.edu.co. Instituto Imani. Sede Leticia.
Cristina Garzón G.: crisga@ciencias.unal.edu.co. Instituto de
Ciencias Naturales.
Gustavo Iván García: gigarciaa@unal.edu.co . Instituto
Imani. Sede Leticia.
* A.A. No 7495 Bogotá-Colombia
Universidad Nacional de Colombia
RESUMEN
En este trabajo,
se presenta una solución al problema de la consistencia y precisión
de la información textual que contiene referencias espaciales
en bases de datos. Se desarrolló un algoritmo que permitiera
el descubrimiento de reglas de asociación de “georreferencia
difusa” a través de la semántica del texto. El texto
se descompone en diferentes tipos de palabras que se denominan variables
de texto vt. Se establecieron unos parámetros probabilísticos
llamados “estados de la solución” para trabajar con
la incertidumbre de las combinaciones del texto. Para resolver el problema
de los diferentes estados, se utilizó un bien conocido algoritmo
de búsqueda en grafos denominado “Hill Climbing”
o ascenso a la montaña, representando cada estado de la solución
en un nodo de un grafo. En el algoritmo se escogen todos los nodos sucesores
de tal manera que sean los mejores sucesores del estado actual y estos
van a ser los más cercanos a la solución. Las coordenadas
son asignadas utilizando el gazetteer colombiano y la cartografía
oficial del IGAC para escala 1:25.000. La implementación del
algoritmo se realizó en Avenue para ArcView 3.2 y los procedimientos
desarrollados se probaron para un caso de estudio en la asignación
de coordenadas x e y para puntos de muestreo de especies botánicas
provenientes de una base de datos con más de 34.000 registros
y con algunos datos recolectados por los alrededores de los años
50, donde la ubicación es bastante vaga. Los resultados fueron
cartografiados con una escala máxima de 1:250.000.
Descargar articulo completo (pdf - 170 Kb)
|
|