Google heeft Gmail voorzien van een nieuw tekstclassificatiesysteem, waarmee het naar eigen zeggen een van de grootste security-upgrades van de afgelopen naar de maildienst brengt.
Het betreft het classificatiesysteem RETVec, kort voor Resilient & Efficient Text Vectorizer. Een maildienst als Gmail is afhankelijk van classificatiemodellen voor het identificeren van schadelijke content. Denk aan phishingaanvallen, ongepaste inhoud en andere vormen van oplichting.
Om het tekstclassificatiesysteem te versterken, heeft Google RETVec ontwikkeld. RETVec helpt de classificatieprestaties van modellen te verbeteren en de rekenkrachtkosten te verlagen. In de onderstaande afbeelding deelt Google cijfers over hoe RETVec het filteren van spam verbetert.
Google geeft aan dat het afgelopen jaar intern RETVec uitgebreid heeft getest om het nut ervan voor classificatie te bepalen. Het systeem bleek zeer effectief voor security- en anti-misbruikdoeleinden. In het bijzonder pakt RETVec goed uit als het een bestaand onderdeel in de Gmail-spamclassificatiefunctie vervangt. Die prestatieverbeteringen zijn te zien in de afbeelding aan de hand van de verstrekte cijfers.
“Bovendien verminderde het gebruik van RETVec het TPU-gebruik van het model met 83 procent, waardoor de RETVec-implementatie een van de grootste defensie-upgrades van de afgelopen jaren werd”, aldus Google.
RETVec boekt de prestatiewinst vooral door gebruik te maken van een lichtgewicht model van zo’n 200.000 parameters. Hierdoor kan Google de grootte van het gebruikte Transformer-model verkleinen, met gelijke of betere prestaties tot gevolg.