Was würden Sie machen, wenn Sie alle Information aus dem Web verfügbar hätten? Wahrscheinlich eine Menge. Es gibt im Netz sehr viele – für Ihr Unternehmen relevante – Daten, aber das Durchsuchen mittels Suchmaschinen verschafft Ihnen nicht den nötigen Überblick, um Informationen zu analysieren und entsprechend zu handeln.
Suchen und Extrahieren
Textkernel bietet Ihnen eine leistungsstarke textverstehende Technologie für online gespiderte Daten. Unsere Technologie ist für die Erstellung gefilterter, strukturierter Datenfeeds aus sehr großer Mengen an unstrukturierten online Quellen, optimiert.
Web Mining widmet sich der Aggregation von Informationen aus dem Web. Viele verschiedene Technologien sind hierfür erforderlich. Das Sammeln von Informationen aus einer Vielzahl von online Quellen, auch bekannt als Wide Coverage Crawling (breite Erfassung), ist hierbei der erste Schritt. Bei einigen Quellen muss das so genannte ‘Deep Web’, mittels extra zugeschnittenen Crawlern, auch miteinbezogen werden. Nachdem die Daten gesammelt wurden, müssen diese kategorisiert werden. Dies geschieht in Bezug auf ihre Relevanz für das jeweilige Interessensgebiet. Die Informationen der Daten werden extrahiert, auf ihre Aktualität überprüft und dedupliziert auf Basis eines Fuzzy Matching ihres Inhaltes. Das Ergebnis ist eine auf Ihr Interessensgebiet spezifische, strukturierte Datenbank von unglaublicher Breite, Aktualität und Relevanz. Und das ohne jegliche manuelle Dateneingabe!
- Weiter mit Semantische Informationssuche und Matching
- Zurück zu Technologie