Velen kennen SPSS (Statistical Package for the Social Science) als software om data te analyseren. Minder bekend zal zijn dat SPSS heden ten dage twee verschillende producten vertegenwoordigt. In vogelvlucht een stukje geschiedenis …
In 1968 stelde een wetenschapper (Norman Nie) zijn zelf-geschreven (Fortran) code ter beschikking aan een breder publiek, waarmee het bedrijf SPSS Inc. geboren was. In die jaren was de belangrijkste toepassing van SPSS het analyseren van survey data (enquêtes). In de beginjaren commandogestuurd, later met een grafische interface zodat je geen code meer hoefde te schrijven om je data te kunnen analyseren (code blijft overigens relevant, met name om analyses te automatiseren).
Eind jaren ’80 begonnen bedrijven klantgegevens te verzamelen voor hun bedrijfsprocessen, bijvoorbeeld met het oog op Customer Relationship Management. Het was toen nog maar een kleine stap om de statistische methoden die gebruikt werden voor surveys ook toe te passen op deze gegevens. Zo werd data mining populair, het verkrijgen van inzichten door te grasduinen in gegevens.
In de jaren ’90 nam SPSS Inc. een bedrijf genaamd ISL over; ISL liep voorop in deze ontwikkelingen, mede door een revolutionaire grafische interface (voor meer info, zoek bijvoorbeeld op The Story of Clementine).
Vanaf dat moment voerde SPSS Inc. dus twee producten, namelijk ten eerste software die iedereen kende als SPSS en ten tweede Clementine. Met de overname van SPSS Inc. door IBM in 2009 werden deze producten hernoemd tot IBM SPSS Statistics respectievelijk IBM SPSS Modeler. Het ‘oude’ SPSS is momenteel dus officieel IBM SPSS Statistics en wat ooit Clementine was is nu IBM SPSS Modeler. Dit gezegd hebbende, de naam ‘SPSS’ is dermate ingeburgerd dat aan IBM SPSS Statistics in de wandelgangen nog steeds wordt gerefereerd als ‘SPSS’. Op onze website zullen we de namen IBM SPSS Statistics en IBM SPSS Modeler duidelijkheidshalve wel gebruiken.
Zowel IBM SPSS Statistics als IBM SPSS Modeler bieden functionaliteit om data te analyseren. IBM SPSS Statistics is vooral geënt op survey data, met data preparatie functionaliteit, een breed scala aan statistische analyses, fraaie presentatie mogelijkheden, en visualisaties. In IBM SPSS Modeler daarentegen zie je de focus op data mining terug; alles staat in het teken van modellenbouw. In retrospectie zou je zelfs kunnen zeggen dat IBM SPSS Modeler de eerste no code data science software was. Zo kun je met IBM SPSS Modeler bijvoorbeeld binnen in een mum van tijd een Machine Learning model bouwen.
De Data Analyse Academie ondersteunt gebruikers van zowel IBM SPSS Statistics als IBM SPSS Modeler, met blogs, webinars, workshops, publieke- en in-company cursussen, coaching on the job, train-de-trainer cursussen, en meer.