Anhand von gut 3000 vorklassifizierten textlichen Informationen von Patenten aus dem 3GPP-Telekommunikationssektor hat die dwh GmbH mehrere intelligente Klassifikatoren designt, die anschließend zigtausend weitere Patente automatisiert ihren entsprechenden Klassen zuweisen können.
Diverse Bag-of-Words-Modelle transformieren die Texte in einen geeigneten Input für die Klassifikatoren, die je nach Anforderung die Patente entweder einer oder auch mehreren Klassen zuweisen. Zusätzlich wurde auch mit Keyword-Listen gearbeitet, um eine noch feinere Unterteilung der Klassen zu erzielen.