Informations non structurées
Les informations non structurées ou données non structurées sont des données représentées ou stockées sans format prédéfini. Les données non structurées sont typiquement constituées de texte brut, mais peuvent également contenir des dates, des nombres et des faits. Cette absence de format entraîne des irrégularités et des ambiguïtés qui peuvent rendre difficile la compréhension des données, contrairement au cas des données stockées dans des tableurs ou des bases de données par exemple, qui sont des informations structurées.
Un nouveau paradigme
Dans un livre blanc publié en octobre 2007, le Cigref indique que les informations non structurées correspondent à un nouveau paradigme, tant sur le plan de l'évolution des techniques, que de l'évolution des structures de gouvernance et de l'évolution des rapports à l'information. Concernant ce dernier point, les informations non structurées correspond à une tendance qui s'étend avec l'apparition de ce que l'on appelle le web 2.0, qui comprend un volet technique et un volet social (voire sociétal), le second étant prépondérant. Le volet social s'organise autour de la démocratisation du Net, par la prise en compte des communautés et des réseaux sociaux, et par la promotion de la contribution des internautesLivre blanc - Valorisation de l'information non structurée, p. 15</ref>.
Enjeux
Les enjeux pour l'entreprise sont[1] :
- l'anticipation ;
- la maîtrise des coûts ;
- le respect de la conformité légale ;
- la continuité et la gestion des risques.
Types d'applications qui gèrent des informations non structurées
Les traitements de texte, le web 2.0 (notamment les wikis), les systèmes de gestion des connaissances, les systèmes de gestion de contenu et les outils d'intelligence économique travaillent essentiellement avec des informations non structurées.
Notes et références
Voir aussi
Articles connexes
- Informations structurées
- Web 2.0
- Wiki
- Exploration de données
- Architecture générale pour le traitement de texte
- Métadonnée
- Reconnaissance de formes
Liens externes
- Livre blanc - Valorisation de l'information non structurée, APIL, Aproged, Cigref, octobre 2007