Intel-Forscher erklären, wie sie künstliche Intelligenz eingesetzt haben, um GTA V realistisch zu gestalten

Nach fast acht Jahren Grand Theft Auto V Freigegeben, Einleger werden immer noch reich – und Sabotage – Bilder des berühmten Spiels.

Letzte Woche haben Forscher von Intel Labs eine KI-gestützte Überarbeitung der Rockstar-Klassiker vorgestellt, die die Grafik dem Realismus näher bringt.

TNW sprach mit dem Intel-Forschungswissenschaftler Stephen Richter, um mehr über die Technologie und die Möglichkeit der Herstellung der Methode zu erfahren.

Der Eckpfeiler der Intel Labs-Methode ist das Faltungsnetzwerk, eine Deep-Learning-Architektur, die üblicherweise für die Bildverarbeitung verwendet wird.

Das Team trainierte seine Faltungsnetzwerke auf fotorealistischen Bildern, um sie zu übersetzen GTA V’s Realitätsmodellzeichnungen.

Richter sagte, Faltungsnetzwerke seien gut geeignet, um diese Art von Aufgabe zu lernen:

Für Spiele, Simulationen und Filme ist eine enorme Menge an Arbeit erforderlich, um Dinge, Materialien usw. zu entwerfen, damit sie realistisch aussehen. Richtig eingerichtet, können Faltungsnetzwerke diese Dinge automatisch direkt aus fotorealistischen Bildsätzen lernen.

Das Ergebnis ist erstaunlich realistisch: Autofenster wurden reflektiert, Straßen mit glatterem Asphalt gepflastert und die umgebende Vegetation weist eine subtilere Textur auf.

[Read moreThis dude drove an EV from the Netherlands to New Zealand — here are his 3 top road trip tips]

Der vielleicht interessanteste Aspekt der überarbeiteten Grafik ist die Auswirkung verschiedener Trainingsdatensätze auf die Ausgabe.

In einer Anwendung ihrer Methode trainierten die Forscher das Faltungsnetzwerk anhand eines Stadtbilddatensatzes, einer Reihe von Bildern, die hauptsächlich in Deutschland aufgenommen wurden. Als ein Resultat aus, GTA V’s Die trockenen Hügel wurden aufgeforstet, um das deutsche Klima nachzuahmen, während San Andreas einen Grauton erhalten hat, der Bayern ähnlicher ist als in Südkalifornien.

Siehe auch  Deutsches Drama „Übersetzer des Schweigens“

Als das Netzwerk auf den vielfältigeren Mapillary Vistas-Datensatz trainiert wurde, war der visuelle Ausgabestil heller und lebendiger.

Einige dieser Änderungen spiegeln den Ort wider, an dem die Trainingsfotos aufgenommen wurden. Die anderen Unterschiede sind auf die Kameras zurückzuführen, die die Bilder aufgenommen haben.

Veränderungen in der Vegetation waren zum Beispiel darauf zurückzuführen, dass Stadtlandschaften meist deutsche Städte darstellen. Richter sagte jedoch, die überarbeitete Farbpalette sei auf das Aufnahmegerät zurückzuführen:

Stadtbilder wurden mit einer Autokamera aufgenommen, die diesen charakteristischen Grünton aufweist. Daher erhalten auch Bilder, die so optimiert sind, dass sie wie Stadtlandschaften aussehen, dieses Grün. Die Aussichten wurden mit einer Vielzahl von Kameras aufgezeichnet, darunter beispielsweise Smartphone-Kameras. Die Bilder von Vistas sind lebendiger und Sie können dies in den Ergebnissen mit unserer Methode sehen.

Bildnachweis: Richter, Abu Haija und Clton