Updates zu laufenden Projekten von MI4People

springerpaul4
21. Feb. 2023
5 Min. Lesezeit

Foto von Kevin Ku

Liebe Freunde,

in diesem Newsletter möchten wir etwas Neues ausprobieren und Sie über den Stand all unserer aktuell laufenden Projekte informieren.

Wir hoffen, dass es Ihnen gefällt und Sie dieses neue Format mögen!

Und wie immer gilt: Setzen Sie Ihre Fähigkeiten zur Unterstützung des Gemeinwohls in die Tat um, und lassen Sie uns gemeinsam die Welt zu einem besseren Ort für uns alle machen!

Ihr MI4People-Team

General Computer Vision für das Gesundheitswesen

In diesem Projekt konzentrieren wir uns derzeit darauf, Pathologien auf Röntgenbildern der Brustregion zu identifizieren und dieses System für medizinisches Personal in Entwicklungsländern verfügbar zu machen. Aktuell arbeitet unser interdisziplinäres Team von Freiwilligen in zwei Richtungen:

Unsere Domänenexpert*innen aus dem medizinischen Bereich arbeiten am Konzept einer entsprechenden Anwendung, an der Integration in bestehende Prozesse in Krankenhäusern und am Sammeln von Feedback für unser Konzept von Ärzten in Entwicklungsländern (derzeit hauptsächlich aus Ghana).
Unsere Data Scientists und Ingenieur*innen arbeiten an Datenpipelines, Datenerweiterung und KI-Modelltraining. Während wir mit dem NIH Chest X-Ray Dataset begonnen und Forschungen und Experimente durchgeführt haben, wie diese Daten erweitert und welche Modellarchitekturen trainiert werden können, untersuchen wir derzeit die Option, die Bibliothek TorchXRayVision zu verwenden, die es uns ermöglicht, auf noch mehr Trainingsbeispiele und einige bereits vortrainierte Modelle zuzugreifen.

Wir möchten auch erwähnen, dass die größte Herausforderung dieses Projekts die Ausrichtung in den vorhandenen öffentlichen Daten auf die Bevölkerung in entwickelten Ländern ist – ein auf diesen Daten trainiertes System hätte eine wesentlich schlechtere Genauigkeit, wenn es in Entwicklungsregionen angewendet würde. Daher ist das Hauptziel unserer derzeitigen Bemühungen, ein MVP zu erstellen, das Krankenhäuser, Ärzte, Forscher und Behörden in Entwicklungsländern vom großen Mehrwert unseres Systems überzeugt und sie motiviert, uns beim Sammeln von Röntgendaten zu helfen, die die Bevölkerung jedes betrachteten Landes repräsentieren. Dann werden wir diese Daten für das Transferlernen in unserem vortrainierten Modell verwenden, sodass das resultierende System die relevante Bevölkerung in Entwicklungsregionen abdeckt. Um den Datenschutz zu gewährleisten, diskutieren wir derzeit auch die Möglichkeit, Federated Learning in diesem Projekt anzuwenden. Diese Technik ermöglicht es uns, einen Algorithmus über mehrere dezentralen Server hinweg zu trainieren, die Datenproben lokal speichern, wodurch wir kritische Themen wie Datenschutz, Datensicherheit, Datenzugriffsrechte und Zugriff auf heterogene Daten angehen können.

Wenn Sie mehr über den Hintergrund dieses Projekts erfahren möchten, besuchen Sie bitte unsere Website.

CoVision-Projekt

In unserem CoVision-Projekt arbeiten wir gemeinsam mit dem Bayerischen Blinden- und Sehbehindertenbund an einer kostenlosen und leicht zugänglichen Open-Source-Computer-Vision-App, die CoVid-Schnelltestergebnisse mit mobilen Geräten klassifizieren kann. Dieses System wird es blinden und sehbehinderten Menschen ermöglichen, CoVid-Antigen-Schnelltests selbst durchzuführen. Es wird die Inklusion fördern, den Datenschutz für diese Personengruppe erhöhen und die Tests für sie leichter zugänglich machen.

Wir sind gerade dabei, die letzten Bugs zu beheben und gehen davon aus, dass wir die Beta-Version in 1-2 Monaten veröffentlichen können. Aber das wird nicht das Ende der Geschichte sein und wir wollen die CoVision-App über die Beta-Version hinaus verbessern! Daher denken wir bereits über den Aufbau automatisierter Datenerfassungs- und Datenaufbereitungspipelines für die Sammlung neuer Trainingsdaten, das kontinuierliche Lernen unserer bestehenden Modelle, die Automatisierung des Modellmonitorings und bei Bedarf die Verbesserung bestehender Modelle und das Experimentieren mit neuen Architekturen nach.

Für diese interessanten Aufgaben suchen wir derzeit ein oder zwei zusätzliche Freiwillige mit Erfahrung in den Bereichen Datenwissenschaft und/oder maschinelles Lernen, die uns dabei helfen, dieses wichtige Open-Source-Projekt zur Inklusion blinder Menschen voranzutreiben.

Wenn Sie also Ihre KI/ML-Fähigkeiten für etwas Wichtiges einsetzen und uns bei diesem Projekt unterstützen möchten oder jemanden kennen, der dies tun möchte, kontaktieren Sie bitte unseren Geschäftsführer Dr. Paul Springer auf LinkedIn oder per E-Mail paul.springer@mi4people.org

Für weitere Hintergrundinformationen zum CoVision-Projekt besuchen Sie bitte unsere Website.

System zur Bewertung der Bodenqualität

In diesem Projekt entwickeln unsere Freiwilligen ein kostenloses Machine Intelligence (MI) System, das auf der Grundlage von Satellitenbildern und ohne teure chemische Labortests die wichtigsten Qualitätsindikatoren für den Boden an bestimmten Standorten vorhersagen kann. Gemeinnützige Organisationen und Regierungen können dieses System nutzen, um ihre Ressourcen besser zur Förderung der Landwirtschaft, zur Steigerung der Erträge und zur besseren Sicherung der Lebensmittelketten einzusetzen. Auch Kleinbauern können es nutzen, um ihre Böden besser zu verstehen und ihre Erträge zu steigern. Insgesamt soll das Projekt dazu beitragen, den Hunger in der Welt zu verringern und den Wohlstand in Entwicklungsregionen zu steigern.

Wir haben bereits viele Experimente durchgeführt, darunter die Anwendung klassischer Algorithmen des maschinellen Lernens und Algorithmen des Computer Visions, und einen Proof-of-Concept für den organischen Kohlenstoffgehalt entwickelt. Die klassischen Algorithmen des maschinellen Lernens sind für die Auswertung von Satellitenbildern sehr verbreitet und betrachten Pixel für Pixel eines gegebenen Satellitenbildes. Diese Algorithmen sind schnell, robust, und die Einbeziehung zusätzlicher Daten wie Wetterdaten ist sehr einfach. Allerdings lassen diese Algorithmen einen wichtigen Punkt außer Acht - sie werten die Umgebung des betrachteten Pixels nicht aus und lassen somit eine Menge wichtiger Informationen aus.

Computer-Vision-Algorithmen wurden entwickelt, um dieses Problem zu überwinden, und deshalb konzentrieren wir uns derzeit auf sie. Allerdings benötigen Standard-Computer-Vision-Algorithmen Hunderttausende von Bildern für das Training, und unser verfügbarer Datensatz ist viel kleiner. Daher müssen wir das Transfer-Lernen anwenden, d. h. wir nehmen ein Computer Vision Modell, das mit einem anderen großen Datensatz trainiert wurde, und trainieren es mit unseren Daten um. Dies führt dazu, dass die beim ursprünglichen Training des Modells gelernten Beziehungen beim erneuten Training wiederverwendet werden können und das Modell nur mit wenigen Trainingsbeispielen eine gute Leistung zeigt. Unsere ersten Tests in dieser Richtung waren vielversprechend, aber die Ergebnisse waren nicht so gut wie erwartet. Das Problem besteht darin, dass öffentlich verfügbare vortrainierte Computer-Vision-Modelle auf Bildern aus dem Internet vortrainiert wurden und nicht auf Satellitenbildern, und diese Arten von Bildern sind sehr unterschiedlich. Daher haben wir beschlossen, unser eigenes Modell mit einer für unsere Zwecke geeigneten Architektur mit einer großen Menge an Daten aus dem so genannten BigEarthNet vorzutrainieren. Diese Daten wurden ursprünglich für eine ganz andere Aufgabe als die Bodenbewertung gesammelt und beschriftet, aber sie können für das Vortraining eines Modells verwendet werden. Später werden wir es mit Daten umtrainieren, die für die Bewertung der Bodenqualität relevant sind.

Das anfängliche Training dieses Modells wird eine Menge Rechenressourcen und Trainingszeit in Anspruch nehmen. Daher wird es recht kostspielig sein. Um die Kosten so weit wie möglich zu reduzieren, planen wir die Nutzung von so genannten On-Spot-Instanzen unseres Cloud-Anbieters AWS. Das bedeutet, dass wir die AWS-Server nur dann nutzen, wenn niemand anderes sie nutzen möchte. Für uns bedeutet das, dass wir unsere Berechnungen von Zeit zu Zeit unterbrechen müssen, was mit einem wesentlich komplexeren Code verbunden ist und das Modelltraining deutlich länger dauern wird. Aber wir werden in der Lage sein, unser Modell mit einem Bruchteil des erforderlichen Budgets vorzutrainieren! Daran arbeitet das Team derzeit.

Um mehr über die Idee dieses Projekts zu erfahren, lesen Sie diesen Artikel.

Projekt zur Erkennung von Meeresmüll über Satelliten

Dies ist unser jüngstes Projekt, und das entsprechende Team von Freiwilligen aus Alexander Thamm führt derzeit eine Menge Forschungsarbeit durch, versucht einige der veröffentlichten Forschungsergebnisse zu replizieren und macht sich mit den öffentlichen Daten vertraut, die wir für dieses Projekt nutzen wollen. Wir werden im Laufe des Jahres mehr über die Fortschritte dieses Projekts berichten!

Abschließende Bemerkung

An dieser Stelle möchten wir einen großen Applaus für alle derzeitigen und ehemaligen Freiwilligen aller unserer Projekte aussprechen! Ohne ihre Arbeit und ihr Engagement wäre MI4People nicht möglich! Wir möchten auch Sie dazu motivieren, diesen großartigen Menschen Ihre Anerkennung zu zeigen! Und wenn auch Sie uns unterstützen wollen, sind Sie jederzeit willkommen. Bitte besuchen Sie unsere Website (https://de.mi4people.org/) um herauszufinden, wie Sie uns unterstützen können! 😊