Er wordt veel magisch (oplos)vermogen toegeschreven aan data analyse. Wanneer je hier goed over na denkt en dit correct in elkaar steekt dan zou het praktisch elk probleem oplossen en kan het voor bijna elke situatie worden ingezet. Zeker voor problemen die je altijd al hebt gehad, maar waarvoor je niet genoeg mensen kon inhuren om op te lossen. Of voor problemen met een duidelijk doel, maar waarvoor geen goede aanpakmethode bestaat. In deze blog gaan we de 6 belangrijkste mythes en legendes die de ronde doen SMART maken.
 

# 1: Machine learning is AI 

Technisch is het verschil in aanpak tussen machine learning en AI groot. Machine learning is het herkennen van patronen en het voorspellen van uitkomsten op basis van grote datasets. Eigenlijk statistiek “on steroids” en een RPA programma is daarna vaak een logisch gevolg voor de aanpak van de gevonden uitkomsten. Artificial Intelligence of kunstmatige intelligentie is veel breder in de aanpak en hier gebruikt men visualisatietechnieken, natural language processing en allerlei andere vormen van data die vaak als “unstructured” wordt bestempeld. 
 

#2: Alle data is bruikbaar 

Niet alle data sets zijn bruikbaar, de data sets om een model of systeem te trainen  moet wel relevant zijn. Een dataset met klantgegevens vanuit een Duitse zusterorganisatie is niet relevant voor je bedrijf in Nederland. Een model is immers een optimale weergave van jouw perfecte bedrijfsomgeving en het systeem  faciliteert het model maar geeft ook de zogeheten systeemgrenzen aan. 
 

#3: Je hebt altijd veel data nodig 

Dit is een trucje om sneller een model en systeem te trainen, het bekendste voorbeeld is het trainen van het Alpha-Go model waarmee de beste Go speler ter wereld in zes partijen werd verslagen. Door voorgetrainde modellen te gebruiken op gestandaardiseerde datasets kan je namelijk voorkomen dat je paden gaat betreden die leiden tot niets, oplossingsrichtingen die geen uitkomst bieden. Een andere manier om hier mee om te gaan is het intelligent kiezen van de set van invoerparameters, feitelijk voorkom je dan ook dat je onmogelijke oplossingrichtingen gaat onderzoeken. Is de invoer-parameter “geslacht” relevant bij het beoordelen het succes van een incassobureau middels een data analyse.
 

#4: Alle patronen in de data zijn nuttig 

Je hebt altijd domeinexpertise nodig om de gevonden patronen te beoordelen, we zijn nog lang niet ver genoeg om het beoordelen en beslissen op basis van gevonden patronen geheel aan een machine over te laten. Ondanks de verwoede pogingen die er in films worden gedaan en vaak zeer vermakelijk zijn. In de dagelijkse PHALANXES werkpraktijk zien we dit terugkomen in het ontbreken van de link tussen data science/ data analisten en het interpreteren van de business/ het business model. 
 

#5: Data is onbevooroordeeld 

Data is per definitie subjectief, afkomstig uit systemen die door mensen zijn bedacht en gebouwd. Alle subjectieve patronen zullen dus in de database zijn opgeslagen en in analyse resultaten naar boven komen. Voorbeeld is het trainen van een model met de COCO data set die vaak gebruikt wordt om afbeeldingsherkenningssystemen bevat foto's van mannen en vrouwen. Een groot deel van deze vrouwen wordt echter vaak in de buurt van keukengerei weergegeven terwijl mannen vaker met randapparatuur voor computers, tennisrackets en snowboards worden weergegeven. Als je jouw machine learning systeem traint met COCO dan is de kans groot dat het mannen sneller associeert met computer hardware dan vrouwen. 
 

#6: machine learning zal banen vervangen 

Klopt! Maar niet meer of minder dan in vorige ontwikkelstappen het geval is geweest. Natuurlijk zal het de manier waarop wij ons werk doen veranderen, ons efficiënter maken en kosten verlagen. Het zal ervoor zorgen dat sommige functies overbodig worden, maar veel van de taken waarvoor deze technologie wordt ingezet waren simpelweg niet eerder mogelijk vanwege de complexiteit of de schaal. Je kan nou eenmaal niet duizenden mensen inhuren om een hoop foto's te bekijken die zijn gepost op social media om te kijken of jouw merk erin voorkomt.
Machine learning creëert juist nieuwe mogelijkheden en kan ervoor zorgen dat de klantervaring juist wordt verbeterd. Machine learning maakt het IT-medewerkers juist alleen maar makkelijker.
 
Meer weten over de mogelijkheden van data analyse of een keer een (data)intelligente omgeving bekijken? Neem contact op met BVCM of direct met Igor Wortel via igor@phalanxes.eu of +31 614 245 649
  • Igor Wortel