Im letzten Blog-Beitrag habe ich die Bedeutung von Metadaten in Suchalgorithmen erörtert. Dabei hatte ich auf Theorien verwiesen über die einander ähnelnden Verhaltensweisen von Gruppen (oder „gleich gesinnten Nutzern“) und die Berücksichtigung solcher Sozialstrukturen in Ranking-Algorithmen zur Sprache. Forscher wissen schon länger wie nützlich soziale Metadaten sind. Doch werden diese Ideen in real existierenden Produkten umgesetzt? Soziale Netzwerke wären jedenfalls der passende Ort.
„Graph Search“ und das Prinzip gleich gesinnter Nutzer
Nun ja, mit der Facebook -„Graph Search“ wurden sie zumindest in einem der Netzwerke Realität. Wer die „Graph Search“ (derzeit noch in der Beta-Version) aktiviert hat, weiß, dass er Suchanfragen wie „Freunde in Berlin, die Pizza mögen“ eingeben kann und Facebook daraufhin seine interne Metadaten-Struktur, die in der Branche als „Social Graph“ bekannt ist, nach diesen Informationen durchsuchen wird. Hier fließen all die „Gefällt mir“-Angaben ein, die Facebook sammelt.
Doch die „Graph Search“ kann noch mehr. Sie können auch Anfragen wie „Musik, die mir gefallen könnte“ eingeben, um die Algorithmen von Facebook ganz gezielt zu nutzen. In diesem Beitrag über die „Graph Search“ bezieht sich das Facebook-Team auf das Prinzip der gleich gesinnten Nutzer, oder anders ausgedrückt, auf die Tendenz von Einzelpersonen mit ähnlichen Eigenschaften, sich einander anzuschließen. Einzelne Personen sind über Arbeitsplatz, Beruf, Schule, Vereinszugehörigkeit, Hobbys, politische Ansichten und andere Zugehörigkeitsmerkmale miteinander verbunden.
Facebook verfügt mit den Profilen der Nutzer natürlich über eine ganze Menge derartiger sozialer Metadaten. Die „Graph Search“ durchsucht bei Anfragen nach Musikvorschlägen die Profile von Freunden, um über Angaben zu Schule, Lieblingsessen usw. die Nutzer zu finden, mit denen der Suchende am meisten gemeinsam hat. Anschließend werden die musikalischen Vorlieben aus dem Social Graph entsprechend der Vernetzung mit diesen Kontakten aufgelistet.
Nach allem, was Facebook über die Hintergründe des Suchdienstes preisgegeben hat, nehme ich an, dass er auf dem im letzten Blog-Beitrag erläuterten SAN-Modell basiert. Auf jeden Fall können Sie in einem anderen Beitrag, in dem das Facebook -Technikteam den „Entity Graph“ (d. h. den Social Graph) erklärt, genaueres über diesen Prozess lesen, von der maschinellen Sprachverarbeitung bis hin zum Ranking.
Social Graphs und Datenschutz
Diese Konzepte lassen sich auch auf die unternehmensweite Suche in Dateisystemen anwenden. Mithilfe von Metadaten zu Dateiaktivitäten findet man gemeinsame Präferenzen: Wenn zwei Personen auf dieselbe Datei zugreifen, entspricht das einer „Gefällt mir“-Angabe. Und es gibt auch etwas, das einer direkten Gruppenzugehörigkeit entspricht: Die Active-Directory-Gruppen, zu denen ein Nutzer gehört, sind mit Vereinszugehörigkeiten oder politischen Parteien vergleichbar.
Das bedeutet, dass das Ranking der Ergebnisse viel sinnvoller gestaltet werden könnte. So ist eine unternehmensweite Suche in einem Dateisystem nach dem Begriff „Marketingstrategie“ mit einer Facebook-Suche nach dem Schema „Marketingstrategien, die mir gefallen könnten“ vergleichbar. Eine unternehmensweite Suche auf der Grundlage des SAN-Modells wäre ideal geeignet, um Präferenzen vorherzusagen. Dabei würde sie weit über die Möglichkeiten einer einfachen Textsuche, wie sie zum Beispiel mit einem systemeigenen Befehlszeilentool durchgeführt werden kann hinausgehen.
Man muss Facebook zugutehalten, dass das Unternehmen offen über potenzielle Probleme der „Graph Search“ informiert. Denn wenn die „Graph Search“ Ihnen aufgrund der Metadaten zu anderen Mitgliedern Ihrer Gruppe oder „Herde“ sagen kann, was Ihnen gefällt, könnten Sie aus den Profilen Ihrer Freunde mit ähnlichen Vorlieben möglicherweise mehr herauslesen, als diesen recht ist. Facebook rät ausdrücklich, für Fotos und andere vertrauliche Informationen die Option „Nur ich“ auszuwählen, um zu verhindern, dass sie von der „Graph Search“ ausgewertet werden.
In anderen sozialen Netzwerken gibt es dieselben Datenschutzrisiken; Facebook ist hier keine Ausnahme. Vor allem Minderjährige unter zwölf Jahren sind der Gefahr der virtuellen Belästigung ausgesetzt. Aus diesem Grund liegt der Schwerpunkt der neuen Regelungen des US-Gesetzes zum Schutz der Privatsphäre von Kindern im Internet (COPPA, Children’s Online Privacy Protection Act) auf Metadaten und elterlicher Kontrolle.
Gibt es ein ähnliches Zustimmungsverfahren für das Enterprise-Search-Modell? In diesem Fall ist die Analogie in den Dateiberechtigungen und der Dateiklassifizierung zu sehen. Nutzer in Unternehmen, in denen eine unternehmensweite Suche möglich ist, müssen bedenken, dass alle Mitarbeiter die Inhalte in gemeinsam genutzten Ordnern der Abteilungen durchsuchen können. Am Arbeitsplatz soll die Zusammenarbeit natürlich gefördert werden. Doch niemand würde behaupten, dass freigegebene Ordner der Rechtsabteilung außerhalb des zuständigen Bereichs frei zugänglich oder dass regulierte Dateien mit personenbezogenen Informationen uneingeschränkt durchsuchbar sein sollten. Ordner und Dateien mit bestimmten Inhalten oder von bestimmten Abteilungen muss man also bei der Suche ausnehmen können.
In meinen letzten Blog-Beiträgen habe ich argumentiert, dass Metadaten ein äußerst nützliches Mittel sind, um im Web nach allgemeinen wie sozialen Inhalten zu suchen und dass man diese Methode grundsätzlich auch im Unternehmensbereich erfolgreich einsetzen kann. Nach meinem Kenntnisstand verfügen die meisten Unternehmen jedoch nicht über die Prozessorleistungen von Giganten wie Facebook oder Yahoo.
Wie ich bereits erwähnt hatte: selbst im vergleichsweise überschaubaren Umfeld der Dateisysteme haben wir es bei der unternehmensweiten Suche mit einem Big-Data-Problem zu tun. Ein Problem, für dessen Lösung man spezielle Methoden benötigt.
In einem meiner nächsten Beiträge werde ich näher auf die technischen Herausforderungen bei der unternehmensweiten Suche eingehen.
The post Soziale Aspekte und Datenschutz beim Thema „unternehmensweite Suche“ appeared first on Varonis Deutsch.
Wie soll ich vorgehen?
Im Folgenden finden Sie drei Möglichkeiten, wie Sie das Datenrisiko in Ihrem Unternehmen verringern können:
Vereinbaren Sie eine Demo mit uns, um Varonis in Aktion zu erleben. Wir passen die Session an die Datensicherheitsanforderungen Ihres Unternehmens an und beantworten alle Fragen.
Sehen Sie sich ein Beispiel unserer Datenrisikobewertung an und erfahren Sie, welche Risiken in Ihrer Umgebung lauern könnten. Varonis DRA ist völlig kostenlos und bietet einen klaren Weg zur automatischen Sanierung.
Folgen Sie uns auf LinkedIn, YouTubeund X (Twitter), um kurze Einblicke in alle Themen der Datensicherheit zu erhalten, einschließlich Data Security Posture Management (DSPM), Bedrohungserkennung, KI-Sicherheit und mehr.