Suchmaschine | Zukunftswerkstatt Kultur- und Wissensvermittlung e.V.

ZW-Tool – Crotos

Screenshot: Der Hamburger Hafen als Motiv

Crotos ist eine Sammlung von Werkzeugen zur Suche und Darstellung von Werken der bildenden Kunst, welche in Wikidata semantisch erschlossen sind.

Screenshot: Motive nahe der Londoner Themse

Zu Crotos gehört auch Callisto, ein kartenbasiertes Werkzeug zur Suche nach den Orten der dargestellten Motive sowie den Standorten der Sammlungen und Kunstwerke.

Zum Potential der Erschließung des kulturellen Erbes mit Wikidata erschien kürzlich ein lesenswerter Artikel:

The data are incomplete, but these are the early days of an ongoing and ambitious project to share data about cultural heritage—all of it.

Dr. Martin Poulter: Wikidata: the new hub for cultural heritage

C.K.

22. Januar 2017 at 12:54 digitaleallmende 1 Kommentar

Spaactor ist eine Spezialsuchmaschine für audiovisuelle Medien. Basierend auf einer Spracherkennungstechnologie, die Sprache in Text umwandelt, werden gesprochene Inhalte in Audio- oder Videodateien auffindbar.

Screenshot: Darstellung einer Audio-Fundstelle

Screenshot: Suchergebnisse können geteilt werden

Durchsucht wird eine große Zahl an Mediatheken, neue Quellen können vorgeschlagen werden. Vorerst erfolgt die Suche nur in deutscher Sprache. An einer englischsprachigen Suche wird gearbeitet, die Ausdehnung des Angebots auf weitere Sprachen ist geplant.

Für angemeldete Nutzer besteht die Möglichkeit, Suchaufträge einzurichten und deren Ergebnisse zu exportieren.

Danke an Christoph Steiner vom digithek blog für seinen Tipp!

C.K.

14. Januar 2017 at 20:04 digitaleallmende Hinterlasse einen Kommentar

ZW-Tool – Terrapattern

Terrapattern ist ein Recherchewerkzeug, mit dem Satellitenbilder nach visuellen Merkmalen* durchsucht werden können.

Wird ein bestimmter Ausschnitt auf dem Satellitenbild markiert, listet Terrapattern Fundstellen und Bildausschnitte mit ähnlichen visuellen Mustern. So lassen sich beispielsweise Brücken, Solarpaneele, Sportplätze oder Industrieanlagen entdecken.

Noch befindet sich das OpenSource-Projekt in einem frühen Entwicklungsstadium. Aber schon die alpha-Version der Spezialsuchmaschine für Satellitenbilder lässt erkennen, welche Recherchemöglichkeiten sie Journalisten, Forschern oder Aktivisten eröffnet.

C.K.

* Vgl. Tool der Woche – TinEye

8. Juli 2016 at 06:00 digitaleallmende Hinterlasse einen Kommentar

ZW-Tool – Google Custom Search Engine

Mit Google Custom Search Engine lassen sich benutzerdefinierte Suchmaschinen erstellen und in die eigene Webseite einbinden. In der kostenlosen Basisversion stehen vier Suchoptionen zur Verfügung:

Einzelne Seiten werden durchsucht.
Gesamte Webseiten werden durchsucht.
Teile von Webseiten werden durchsucht.
Gesamte Domains werden durchsucht.

Die Suchoptionen ermöglichen es, die Strukturmomente der zu durchsuchenden Webseiten zu berücksichtigen. Anhand einer internen Liste lassen sich mehrere Abfragen für eine Suchmaschine definieren. So lassen sich gleichzeitig mehrere Webseiten oder Subdomains durchsuchen. Die Bedienungsmöglichkeiten und die Ergebnispräsentation können individuell konfiguriert werden.

Abb. 1: Für Geograph Deutschland habe ich eine kleine Suchmaschine erstellt.

Abb. 2: Die Informationsseiten der eingestellten Fotos werden durchsucht.

Abb. 3: Die Bildersuche ist aktiviert und die Treffer werden in Form einer Liste ausgegeben.

Leider lassen sich, jedenfalls in der kostenlosen Version, keine Suchstrings mit Operatoren erstellen. Selbst wenn komplexe Suchstrings nicht immer benötigt werden – es macht Spaß, welche zu bauen…

C.K.

22. Januar 2016 at 05:00 digitaleallmende Hinterlasse einen Kommentar

Tool der Woche – TinEye

TinEye ist eine inhaltsbasierte Bildersuchmaschine: Zuerst muss über eine Webadresse, per Upload oder Drag & Drop ein Ausgangsbild zur Verfügung gestellt werden.

TinEye ermittelt Bilder, deren Inhalte dem des Ausgangsbildes möglichst ähnlich sind. Die Suche erfolgt also nicht über eine Beschreibung, Metadaten oder Schlagworte, sondern über die inhaltlichen Merkmale des aktuellen Ausgangsbildes:

„Inhaltsbasiert“ (content based) bedeutet dabei eine Analyse des aktuellen Inhaltes eines Bildes, also der Farben, Umrisse, Oberflächen (Texturen) oder anderer Informationen (sogenannte Merkmalsvektoren), die über eine automatische Bildverarbeitung ermittelt werden können. […] Die Aufgabe der Bildersuche ist es, eine Liste vorhandener Bilder so zu sortieren, dass die gesuchten Bilder (etwa anhand eines Referenzbildes) möglichst weit vorne stehen. Bilder werden anhand ihrer Ähnlichkeit zum Referenzbild sortiert, die sich durch eine Distanzfunktion und die Merkmalsvektoren der Bilder bestimmt. Ein Qualitätsmaß beurteilt die Sortierung, die maßgeblich von der Wahl der Merkmalsvektoren und des Ähnlichkeitsmaßes abhängt. (Wikipedia: Content Based Image Retrieval)

TinEye ist ein nützliches Tool, wenn zu einem vorliegenden Bild keine verlässlichen Informationen zur Verfügung stehen. Bei meinen Probesuchen konnte ich ein historisches Gebäude, eine Person der Zeitgeschichte und ein berühmtes Gemälde identifizieren.

Zu einer Bildvorlage können mit Hilfe der inhaltsbasierten Suche abgeleitete Versionen des Bildes oder andere Orte seiner Verwendung im Netz ermittelt werden. Bei der sogenannten Rückwärts-Bildersuche (Reverse Image Search) kann unter Umständen der ursprüngliche Ort der Veröffentlichung eines Bildes und damit sein Urheber ermittelt werden.

Aber natürlich sollte man sich nie ohne kritische Wachsamkeit auf die Ergebnisse einer Suchmaschine verlassen.

C.K.

Wikipedia: List of CBIR engines

23. Januar 2015 at 10:27 digitaleallmende 2 Kommentare

Tool der Woche – Qwant

Unser Tool der Woche ist die Suchmaschine Qwant, zu der auch ein eigenes soziales Netzwerk gehört. Qwant ordnet die Suchergebnisse in verschiedene Rubriken ein und bietet die Möglichkeit, diese nach Spalten oder Zeilen geordnet anzuzeigen: Web, News, Social, Shopping sowie Bilder und Videos. Dies sorgt für eine übersichtliche Gliederung der Ergebnisse. Mit dem Qnowledge Graph greift Qwant auf strukturierte Informationen in der Wikipedia zurück.

Zusätzlich bietet Qwant eine gesonderte Medien- sowie eine Personensuche an. Die Personensuche greift, ebenso wie die Social-Rubrik, auf soziale Netzwerke zurück und eignet sich daher gut für die Recherche nach Personen des öffentlichen Lebens, zum Beispiel Autoren, Schauspieler oder Wissenschaftler.

Wer möchte, kann sich einen eigenen Account einrichten und hat die Möglichkeit, zu seinen Recherchen eigene Notizbücher und Aufzeichnungen anzulegen und diese anderen zur Verfügung zu stellen.

Der Suchmaschinenanbieter wirbt mit einem stärkeren Datenschutz als bei anderen Anbietern, so würden bei der unangemeldeten Suche beispielsweise keine personenbezogenen Daten dauerhaft gespeichert. Nähere Informationen zum Anbieter bietet der Wikipedia-Artikel.

Qwant scheint mir besonders geeignet für die Suche nach aktuellen Informationen in Nachrichtenquellen, der Blogosphäre und Social Media. Spannend ist die Idee, ein soziales Netzwerk zum Erstellen und Teilen von Suchergebnissen anzubieten.

C.K.

9. Januar 2015 at 10:40 digitaleallmende 1 Kommentar

Tool der Woche – Wayback-Machine

Unser Tool der Woche ist diesmal die Wayback-Machine, eine Spezialsuchmaschine, mit der die vom Internet Archive archivierten Internetseiten abgerufen werden können. Die Wayback-Machine stellt auch ein Tool zur eigenen Archivierung von Internetseiten dar.

Zum Einstieg gibt es bei YouTube ein Statement zur Web-Archivierung von Brewster Kahle, dem Begründer des Internet Archive.

Um das Web-Archiv zu durchsuchen, muss eine bestimmte Webadresse in das Suchfeld eingegeben werden. Es öffnet sich eine Kalenderansicht, mit der die unter dieser Adresse gefundenen und archivierten Seiten abgerufen und angezeigt werden können.

Abb. 1: Kalenderansicht über die archivierten Seiten einer Adresse

Das Internet Archive archiviert Schnappschüsse (Snapshots) der Internetseiten, aber nicht im Sinne eines Bildschirmfotos, sondern deren HTML-Struktur. Zu jeder archivierten Version einer Seite erhält man einen Permalink, mit dem sich diese referenzieren lässt.

Abb. 2: Die Domain unserer Zukunftswerkstatt wurde zuvor für ein anderes Projekt genutzt

Beim Stöbern offenbart sich schnell ein Problem, welches für den professionellen Gebrauch unbedingt bedacht werden sollte – die unregelmäßige und unvollständige Indexierung: Wurden viele Schnappschüsse in kurzen zeitlichen Abständen hinterlegt, so spiegelt dies nicht unbedingt einen Veränderungsprozess der archivierten Internetseite wider. Ebenso können Archivierungslücken die Rekonstruktion eines Veränderungsprozesses verunmöglichen. Bei vielen Seiten wurden die Unterseiten nicht mit archiviert, interne und externe Links führen zuweilen ins Leere. Dies gilt besonders für die Archivierung eingebetteter Inhalte.

Abb. 3: Ein Blick in die Entstehungszeit der Wikipedia

Ebenso faszinierend wie die Expeditionen in die Internet-Geschichte ist die Möglichkeit, selbst Internetseiten zu archivieren: Die betreffende Adresse wird eingetragen und, soweit keine technischen Hürden bestehen, ein Schnappschuss hinterlegt. Wie bei den bereits hinterlegten Seiten erhält man nun einen Permalink zur archivierten Internetseite.

Somit stellt die Wayback-Machine für Blogger oder Wiki(pedia)-Autoren ein besonderes Werkzeug dar: Meldungen oder Inhalte, die vielleicht nur für einen begrenzten Zeitraum verfügbar sind, können so dauerhaft archiviert und referenziert werden. Es entfällt das Risiko, das Links im Laufe der Zeit inaktiv werden oder nicht mehr zu der gewünschten Information führen. Wer selbst Internetseiten archivieren möchte, sollte darauf achten, auch die Unterseiten einer Domain aufzurufen und zu archivieren. Bleibt die Pfadstruktur erhalten, können so auch die archivierten Unterseiten dauerhaft abgerufen werden.

Zum Abschluss sei hier noch auf die Diskussion auf der re:publica 2014 zur Frage „Wer archiviert das Internet?“ hingewiesen, bei der neben Elisabeth Niggemann von der Deutschen Nationalbibliothek auch Alexis Rossi vom Internet Archive zu sehen und zu hören ist.

C.K.

25. Juli 2014 at 08:00 digitaleallmende 3 Kommentare

Zukunftswerkstatt Kultur- und Wissensvermittlung e.V.

Posts tagged ‘Suchmaschine’

ZW-Tool – Crotos

ZW-Tool – Spaactor

ZW-Tool – Terrapattern

ZW-Tool – Google Custom Search Engine

Tool der Woche – TinEye

Tool der Woche – Wayback-Machine

Zukunftswerkstatt im Netz

Zukunftswerkstatt auf Facebook

Zukunftswerkstatt auf Twitter

Blog über E-Mail folgen

Kategorien

#bibtag14

Schlagwörter