Binnen het platform van SAS is veel technologie te vinden om de AI- en analytics-levenscyclus in te richten. Maar waar ligt de focus precies bij de verdere ontwikkeling van het platform? We spraken tijdens het recente SAS Innovate on Tour in Amsterdam met Gavin Day over de koers en speerpunten.
Day is Executive Vice President, Office of the CEO bij SAS en heeft eerder verschillende executive-techposities vervuld. Hij is betrokken bij het samenbrengen van het volledige portfolio rond Viya 4, het nieuwste analyticsplatform van SAS dat cloud-native is. De software moet overal kunnen draaien waar een bedrijf dat wil: de public cloud, private cloud, hybrid cloud, on-premise en on the edge. Oftewel, bedrijven hanteren hetzelfde operationele model voor alle SAS-technologieën.
Wat Day ziet, is dat organisaties nu behoefte hebben aan drie kritieke uitgangspunten als het gaat om de AI- en analytics-levenscyclus: performance, productiviteit en vertrouwen. Rondom die kwaliteiten wordt het platform verder ontwikkeld.
Is de cloud wel goedkoper?
Day haalt in het begin van ons gesprek meteen de performance-categorie aan. Hiermee doelt SAS op de voordelen die AI en analytics kunnen bieden in de cloud. Veel bedrijven maken daar een duidelijke keuze voor vanwege flexibiliteit, robuustheid en kosten. Het staat volgens Day buiten kijf dat flexibiliteit en wendbaarheid gerealiseerd worden via een cloudbenadering. Maar of men de kostenbesparingen waar de industrie een aantal jaar geleden over praatte realiseert, is zeer de vraag.
SAS krijgt op dat kostenvraagstuk veel feedback uit de markt, legt Day uit. De bedrijven waarmee hij praat, reageren vaak verrast op de rekeningen van hun cloudgebruik. Het variabele consumptiemodel maakt het daarbij lastig om de kosten in te schatten.
Als we dit richting de software van SAS trekken, dan kan het consumptiemodel net zo goed voor onduidelijkheid zorgen. Dat komt mede door het gebruik van compute-resources. Bedrijven die SAS Viya gebruiken, trainen modellen in de cloud. Het trainen van modellen kan afhankelijk van de complexiteit soms wel dagen duren. Bedrijven zien deze tijd terug op hun cloudrekeningen. SAS heeft veel ontwikkelwerk gestopt in het versnellen van het trainingsproces juist om dat aan te pakken. Volgens Day is Viya nu dan ook sneller dan menig concurrerend platform, waarbij hij ook naar recent onderzoek verwijst.
Ook storage adresseren
Naast compute zorgt storage ook voor een groot deel van de kosten bij cloud computing. Bedrijven hebben vaak hele grote databases voor analytics, die ook mee moeten verhuizen naar de cloud. De dataopslag moet echter wel voldoen aan moderne eisen rond schaalbaarheid, beveiliging en het snel uitvoeren van queries.
Om dit te ondersteunen, heeft SAS een samenwerking gesloten met SingleStore. Deze gedistribueerde SQL-database beschikt over een engine om operationele en transactionele workloads te ondersteunen. Day geeft aan dat de integratie met deze technologie een van de beste opties is om SAS Viya te draaien. Volgens hem leidt deze combinatie tot een kostenreductie voor storage van 60 procent tot 80 procent, dankzij de datacompressiemethode.
Naast SingleStore gebruiken bedrijven ook andere clouddatabases. Daar wil SAS ook de bestaande integraties verder voor uitbreiden. Zo is er recent een verdere integratie met Snowflake aangekondigd, waarbij SAS Viya beter op de Snowflake-infrastructuur kan draaien. Andere partijen als Microsoft Azure, AWS en Google Cloud blijven ook op de radar van SAS staan.
Progressie door nieuwe productiviteitsnormen
Alles wat we tot nu toe behandelden valt onder de categorie performance. Day geeft aan dat productiviteit echter ook een essentieel element is bij AI en analytics. In eerste instantie wijst hij vooral op de beperkingen waar men vroeger op dit vlak tegenaan liep. Een paar jaar geleden kon het bijvoorbeeld weken duren voordat een data engineer de toegang tot data had geregeld, mede door een volle agenda en de complexiteit van het proces. Wat ook voorkwam, is dat een organisatie een eigen data-integratieframework had gebouwd. Als de verantwoordelijke data-expert de organisatie dan verlaat, gaat alle kennis en daarmee de mogelijkheid om met het framework te werken verloren. Het zijn allemaal factoren die productiviteit in de weg staan en waar idealiter wat aan moet gebeuren.
SAS Viya moet daarom een basis zijn om zoveel en snel mogelijk modellen in productie te krijgen, zodat ze het nemen van beslissingen op basis van data kunnen ondersteunen. Uiteraard op voorwaarde dat het model daadwerkelijk geschikt is om in productie te worden genomen. Zodoende beschikt het platform over componenten voor data pipelining, modelontwikkeling, modelbeheer, modeldeployment en modelperformance. SAS noemt het zoveel mogelijk automatiseren van al die zaken ook wel als het weghalen van computer science uit data science.
In ons gesprek snijdt Day aan dat het cruciaal is om de vaardigheden van medewerkers hiervoor zoveel mogelijk te ondersteunen. In het verleden was SAS een platform waar vaak alleen getrainde SAS-experts mee overweg konden, bijvoorbeeld omdat er enkel ondersteuning was voor de SAS-programmeertaal. Daar is nu verandering in gekomen met de ondersteuning voor Python en R. En wat Day betreft blijven de ogen open voor eventuele extra talen.
Volgens Day is er ook nog productiviteitswinst te boeken als we als mensheid beter om kunnen gaan met data. Oftewel datageletterdheid, waarbij je als individu in staat bent met data om te gaan en het te begrijpen. Je kan dit bereiken door technologie simpeler te maken, maar ook door mensen te trainen. Day geeft aan dat voor SAS beide belangrijk zijn, mede verwijzend naar de globale initiatieven van SAS waarin het samenwerkt met onderwijsinstellingen. Jonge studenten worden hiermee al vroeg in hun leven geïntroduceerd met data science.
Angst wegnemen
Tot slot is er nog de trust-categorie, iets waar steeds meer vraag naar is. Hoewel AI en analytics an sich al meer dan 50 jaar bestaan, ziet de maatschappij het tegenwoordig vanwege de recente ontwikkelingen rondom bijvoorbeeld ChatGPTmet name als iets nieuws. Als er een nieuwe technologie opkomt, dan beginnen mensen zich tegelijkertijd vaak ook zorgen te maken over risico’s. “We moeten ervoor zorgen dat beslissingen die vanuit SAS namens mensen worden genomen, verklaarbaar, transparant en eerlijk zijn. SAS noemt dit responsible innovation”, aldus Day. “Als data uit het verleden bevooroordeeld of ondervertegenwoordigd is, zullen AI gegenereerde beslissingen mogelijk ook bevooroordeeld zijn en onbedoelde gevolgen hebben.”
Hij geeft aan dat met Viya er flink geïnvesteerd is in het bouwen van een platform dat ‘trustworthy AI’ ondersteunt. Als voorbeeld noemt Day de Model Cards, een feature waarmee met een klik op de knop een kaart gecreëerd wordt om een model uit te leggen. Op die manier wordt de data scientist minimaal belast met het responsible innovation-streven, maar is er voor gebruikers en de business een optie om vertrouwen in AI te winnen.
Uiteindelijk heeft SAS allerlei manieren gevonden om trust te adresseren. Vanwege het belang van het onderwerp, gingen we tijdens SAS Innovate on Tour ook in gesprek met Reggie Townsend, Vice President of the SAS Data Ethics Practice. In een volgend artikel zullen we dan ook verder ingaan op trust. Houd Techzine dus goed in de gaten.