sum

Collegenotes & Samenvatting – Data
Analytics & process mining
geschreven door
Tilburgstudent
www.stuvia.com
Gedownload door: pimdl | pimdl@hotmail.com
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
€ 912 per jaar
extra verdienen?
Data Analytics (Summary)
Lecture notes, Studybook & Academic papers
Lecturer : Various
Exams : 2 (Huiswerkopdrachten + schriftelijk tentamen).
Data Analytics College 1 – Introductie
Datum : 31-03 & 26-05
Subject : Data Analytics
Lecturer : D. Suijkerbuijk
Tentamen:
 Tentamen bestaat uit 2 delen (1) Huiswerkopdrachten en (2) schriftelijk tentamen
 De huiswerkopdrachten zijn gericht op het gebruik van SQL (colleges 1 – 3) Inleverdatum
is 14-05-2023. Casus wordt plenair besproken op 09-06-2023 (13:30 – 16:30)
 Het tentamen is een schriftelijk tentamen m.b.t. Process mining (colleges 4 – 7). Het
tentamen wordt afgenomen op 09-06-2023 (10:00 – 12:00)
 Zowel (1) Tentamen als (2) huiswerkopdrachten moeten afgesloten met > 5.5
College 1 is een opfrisser van een aantal eerder behandelde onderwerpen (1) Access Paths, (2)
DBMS Audit.
(1) Access Paths:
Access Paths geven aan hoe een gebruiker toegang krijgt tot data. Access paths worden
gebruikt voor het bepalen van de reikwijdte (i.e. SCOPE) van een audit. De Access path in kaart
brengen helpt de gebruiker om: (a) inzichtelijk te krijgen welke mitigerende controls er zijn (i.e.
firewalls) maar ook (b) om inzicht te krijgen in de complexiteit van de IT-infrastructuur.
Inzicht over access paths kan worden verkregen door interviews (walkthroughs)- aangevuld met
: Applicatie – en infrastructuur landschap-documentatie (i.e. architectuurplaat), beleid,
standaarden, technische design documentatie, procesdocumentatie etc. Informatie wordt
gevalideerd door inspectie van documentatie en systemen (waar mogelijk). De scope van de
audit kan o.b.v. hiervan aangepast worden in samenwerking met de klant als de informatie niet
blijkt te kloppen. Een access path kan als volgt worden weergegeven:
Figure 1: een eindgebruiker heeft Meestal een bepaalde rol/plek binnen de organisatie
(organisatieniveau), op basis van zijn/haar rol maakt deze persoon uit van individuele bedrijfsprocessen
waarbij men applicaties gebruikt om dagelijkse werkzaamheden uit te voeren (Bedrijfsprocesniveau).
Middels deze applicaties zoals een Database Management System of DBMS (MySQL/ORACLE) kan een
eindgebruiker interacteren met de database en andere delen van de IT-infrastructuur (Technisch IT
niveau / Databaseniveau).
Stuvia – Koop en Verkoop de Beste Samenvattingen
Gedownload door: pimdl | pimdl@hotmail.com
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
€ 912 per jaar
extra verdienen?
Stuvia – Koop en Verkoop de Beste Samenvattingen
Als we kijken naar een accesspath voor het scopen van onze audit krijgen we het volgende
overzicht:
Figure 2: Access paths als deel van scoping van audit.
(2) Executing a DBMS Audit:
Een DBMS audit voeren we uit op basis van een baseline en/of framework. Juist daarom is het
belangrijk te snappen wat het verschil is tussen een DBMS Audit Framework en een DBMS
Baseline.
 Een DBMS Audit Framework: bevat veelal generieke IT Controls op DBMS niveau,
welke moeten zijn afgestemd op bedrijfsbeleid. Het audit framework heeft betrekking op
proces- (hoe wordt het uitgevoerd) en procedure (i.e. vastlegging van) niveau
 Een DBMS Baseline is specifiek voor een specifiek stuk (of versie) van technologie denk
hierbij aan de CIS benchmarks. Maar ook baselines moeten afgestemd worden met
bedrijfsbeleid. De implementatie hangt af van de infrastructuur, hard- en software en
bevat vaak geadviseerde technische instellingen/ technologie-specifieke acties die het
product veilig maken.
Framework topics:
 Lifecycle Management (i.e. versiebeheer) inclusief change management
 Vulnerability Management (vulnerability scanning, IT Security Compliance monitoring &
Patch management)
 Access management: Joiners/Movers/leavers, Account- en authorisatie review (High
Privileged accounts en standaard/default accounts), authenticatie-mechanismes
(wachtwoordcontrols en netwerktoegang), Role Based Access Controls en Public
Permissions
 Logging & Monitoring
 Operating System & DBMS Hardening
 Data encryptie (tijdens data opslag of Data at rest- en datatransmissie of data in transit)
 Capacity & Performance Management
 Governance Segregation of duties of SoD tussen System Admins en Data Admins- en
logische SoD binnen de DBMS.
Gedownload door: pimdl | pimdl@hotmail.com
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
€ 912 per jaar
extra verdienen?
Stuvia – Koop en Verkoop de Beste Samenvattingen
 Availability Management : Transaction logs, recovery models, database backups en
backup sites.
Beschikbaarheid en Continuïteit zijn dus NIET HETZELFDE. Bij beschikbaarheid wordt
vastgesteld of alleen het systeem beschikbaar (i.e. benaderbaar) is onafhankelijk van of er data
in zit/bestaat. Continuïteit betekent dat niet alleen het systeem beschikbaar is- maar ook de
noodzakelijke data in het systeem er is. Bij beschikbaarheid spreken we dus over Redundantie
of overtolligheid. Een voorbeeld hiervan is dat een applicatie ook op een back-up server draait,
als de hoofd-server niet meer functioneert. Continuïteit vallen back-ups onder. Een back-up is
nooit redundant en dus betreft continuiteit en geen beschikbaarheid.
(3) Root Cause Analysis:
Tijdens de DBMS-audit kunnen zaken opvallen of observations. Zodra een observatie is
vastgesteld moet worden gevalideerd of de observatie resulteert in: (1) Een exceptie, (2)
Beheerst risico (door compenserende controls) , (3) geaccepteerd risico in het kader van
company policy.
Als we een observatie hebben is het goed om een Root Cause Analysis op te stellen om vast
te stellen of er ineffectieve/ontbrekende governance processen zijn- en de reden waarom
(3) Impact Assessment:
Indien er een observatie is vastgesteld is het belangrijk dat een degelijke impact assessment
wordt gedaan om te kijken wat de invloed is van een observatie op de audit en dus de
observatie gaat resulteren in een bevinding of finding. Op basis van de bevinding wordt
bepaald welke aanvullende werkzaamheden worden uitgevoerd om het risico in te perken. Bij
het bepalen van een observatie binnen een DBMS audit, moet men nadenken over:
 Toegang tot de DBMS, als er een account was die had moeten worden
gesloten/verwijderd. Dan moet worden bepaald: (1) Wat de toegangsrechten zijn van dit
account, (2) of het account nog is gebruikt (na uitdiensttredingsdatum) en (3) of het
account is gebruikt voor het uitvoeren van specifieke transacties.
 Generieke accounts DBMS: Als er generieke accounts en/of admin accounts bestaan met
een standaard-wachtwoord zijn deze dan wel geactiveerd?
 Als logs direct worden weggeschreven op de database is er dan een log-entry hiervan?
Of is dit mechanisme uitgezet? Is er een SIEM-oplossing die hierop controleert?
 Zijn er mitigerende controls die de impact & waarschijnlijkheid van het risico imperken?
Gedownload door: pimdl | pimdl@hotmail.com
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
€ 912 per jaar
extra verdienen?
Stuvia – Koop en Verkoop de Beste Samenvattingen
Gedownload door: pimdl | pimdl@hotmail.com
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
€ 912 per jaar
extra verdienen?
Stuvia – Koop en Verkoop de Beste Samenvattingen
Data Analytics College 2 & 3– Introductie
datanalyse
Datum : 14-04-2023
Subject : Data Analytics
Lecturer : P. Batenburg
Data-analyse is een containerbegrip welke stilstaat bij het toepassen van
(kunstmatige-)intelligentie voor de interpretatie van gegevens om een uitspraak te doen over
een verantwoording en/of een poging tot inventarisatie. Maar controlestandaarden (ISA/NVCOS) geven géén officiële definitie van data-analyse en hoe data-analyse controlezekerheid
oplevert. Dit is in tegenstelling tot gegevensgerichte controle welke sterk is gereguleerd.
Belangrijk is dat Data-analyse niet gelijk is aan een gegevensgerichte controle:
 Een gegevensgerichte controle is volgens de SRA en NBA gedefinieerd als: een
controlemaatregel die is opgezet om afwijkingen van materieel belang op het niveau van
beweringen te detecteren. Gegevensgerichte controles bestaan uit: (1) detailcontroles
(van transactiestromen, rekeningsaldi en in de financiële overzichten opgenomen
toelichtingen); en (2)gegevensgerichte cijferanalyses;
 Een Data-analyse biedt de accountant een hulpmiddel om diepgaande kennis van
processen en transacties te verkrijgen en trends te herkennen. Dit om vervolgens te
bepalen wat de controlerisico’s zijn en de juiste controle-informatie te verzamelen.
Het grootste verschil tussen Data-analyse en een gegevensgerichte controle is het DOEL. Waar
gegevensgerichte controle gericht is op het vinden van afwijkingen van materieel belang- is
Data-analyse gericht op het verkrijgen van inzichten en herkennen van trends in een
Dataset. Bij Data-analyse is vaak sprake van een steekproef- en niet elke uitzondering in de
dataset is fout- of elke fout in de dataset is een uitzondering. Dit is wél het geval bij een
gegevensgerichte controle. Het probleem is 2-ledig: (1) Controlestandaarden geven geen
houvast hoe en of data-analyse controlezekerheid geeft en (2) bij gegevensgerichte controle is
er geen houvast om te bepalen wanneer men voldoende werk heeft gedaan om een gedegen
oordeel te geven. De hoeveelheid controlewerk wordt bepaald door de materialiteit en
gelopen risico, maar een solide maatstaf of formule om de hoeveelheid werk te bepalen is er
niet. ADA of Audit Data Analytics geeft de auditor de mogelijkheid om een analyse uit te
voeren over een grote hoeveelheid complexe data soms 100% van de populatie. Terwijl
Gegevensgerichte controle het toetsen is van verantwoorde gegevens aan de norm.
TIP 1 : Sorteer altijd de populatie o.b.v. omvang
TIP 2 : Bepaal mechanisme waarmee je steekproef steekt en bepaal of deze
representatief is voor de omvang.
Voorbeeld 1 – Euro-steekproef:
Gedownload door: pimdl | pimdl@hotmail.com
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
€ 912 per jaar
extra verdienen?
Stuvia – Koop en Verkoop de Beste Samenvattingen
Trek een steekproef van 4 uit een populatie van 5 transacties:
1) Bepaal de interval: De interval is 500 / 4 = 125 EUR (dus 4 intervallen van 125 euro)
2) Kies het startgetal: Kies getal tussen 0 en interval (bijv. 60 valt binnen de range van 0 en 125
euro)
3) Tel bij het startgetal de interval op: 60, 185 (60 + 125), 310 (185 + 125), 435 (310+125),
560 (435+125)
Getalreeks: 60, 185, 310, 435 en 560.
4) Bepaal hoe vaak een transactie voorkomt:
Betaling 1 komt 2x voor (60 en 185 < 300)
Betaling 2 komt 2x voor (310 en 435 < 500)
Betaling 3 komt 1 keer voor (560 < 600)
Geldsteekproeven zijn goed voor het vinden van te hoog geboekte posten- maar niet goed voor té laag
geboekte posten.
Voorbeeld 2 – Positieve controlesteekproef
 We trekken een steekproef van 1 uit een populatie van 3
 Post 1 is correct omdat de boekwaarde en auditwaarde overeenkomen en dus de juiste kans
krijgen
 Post 2 is te hoog geboekt want de post is voor 100 EUR geboekt terwijl deze 80 EUR waard was.
Deze krijgt in de geldsteekproef een verhoogde kans dan wanneer de correct was geweest.
 Post 3 is te laag geboekt want de post is voor 100 EUR geboekt terwijl deze 120 EUR waard was.
Deze krijgt een kleinere kans dan wanneer de post correct was geweest.
Bij onze analyse moeten we stil staan op HOE GROOT de kans is dat een onbekend foutbedrag
in de populatie staat.
Figure 3: De horizontale as (0 t/m 20 mln) bevat de onbekende foutbedragen, De vertical as (0 t/m 1)
bevat de KANS. De rode verticale lijn is de geprojecteerde fout binnen de steekproef. De
Gedownload door: pimdl | pimdl@hotmail.com
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
€ 912 per jaar
extra verdienen?
Stuvia – Koop en Verkoop de Beste Samenvattingen
geprojecteerde fout is de meest waarschijnlijke hoogte van het foutieve bedrag bij de integrale controle.
De Maximale fout is de maximale fout die in de populatie mag zitten.
De verhouding tussen maximale fout en uitvoeringsmaterialliteit:
We beoordelen het (1) het verschil tussen de geprojecteerde- en maximale fout en (2) hoe dit
verschil zich verhoudt t.o.v. de uitvoeringsmaterialiteit. Zie dit voorbeeld onder:
Figure 4: Bij situatie 1 is het verschil tussen de geprojecteerde- en maximale fout 3% (0 – 3 %), dit is
gelijk aan de uitvoeringsmaterialiteit van 3%. Bij situatie 2 is het verschil 3,75% (1 – 4,75%), dit is meer
dan 3% uitvoeringsmaterialiteit en dus moet de steekproef worden worden vergroot. Bij situatie 3 is het
verschil 2,15% dit ligt dicht bij de uitvoeringsmaterialiteit van 3%, door de geprojecteerde fout te
verhogen wordt de afstand kleiner. Hiermee doen we de veronderstelling dat meer foutieve bedragen in
de populatie verwacht kunnen worden. Bij situatie 4 is géén probleem. Het verschil van 1,59% ligt
beneden de 3% uitvoeringsmaterialiteit.
Voorbeeld:
(zie elder et al. 16.5 pag. 551 – 556)
Hart Lumber company heeft een populatie van 4.000 debiteuren accounts met een totale
waarde van $600.000 . De Tolerable misstatement (of performance materiality) is gezet of
$21.000
 Acceptable Risk of Incorrect Acceptance (ARIA) = 10%
 Acceptable Risk of Incorrect Rejection (ARIR) = 25%
 Estimate Point estimate of population misstatement = $1.500
 Schatting/estimate van standard deviatie in populatie = $20
Je krijgt dit schema:
Confidence level % ARIA
%
ARIR
%
Confidence
Coëfficient
99 % 0,5% 1% 2.58
95 % 2,5% 5% 1.96
90 % 5% 10% 1.64
80 % 10% 20% 1.28
75 % 12,5% 25% 1.15

0 % 50% 100% 0.00
Bepaal de sample grootte!
N (Populatie grootte) = 4.000 Accounts
n (initiële sample size) = ?
TM (Tolerable Misstatement for = 21.000
Gedownload door: pimdl | pimdl@hotmail.com
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
€ 912 per jaar
extra verdienen?
Stuvia – Koop en Verkoop de Beste Samenvattingen
population)
Za (Confidence coefficient ARIA) = 1.28 (o.b.v. 10% ARIA leidt dit tot coefficient
van 1.28)
ZR (Confidence coefficient ARIR) = 1.15 (o.b.v. 25% ARIR leidt dit tot coefficient
van 1.15)
E* (estimated point estimate population = 1.500
Misstatement)
SD* (Standaard Deviatie in populatie) = 20
n=[
SD ×( Z A+ZR) ×N
TM−E
¿
]
2
n=[
20×(1.28+1.15) ×4000
21.000−1.500
]
2
=(9.97)
2=100 samples
Audit Risk model:
Het Audit Risk Model wordt vaak gedefinieerd als:
 Acceptable Audit Risk (AAR) = inherent Risk (IR) x Control Risk (CR) x Planned
Detection Risk (PDR)
o PDR is in dit geval het steekproefrisico
 Het Audit Risk Model (ARM) is een handige manier om accountants te laten denken in 3
stappen :wat is het risico dat iets materieel fout gaat (IR), wat heeft de gecontroleerde
daar zelf aan gedaan (CR) en wat moet de controleur nog doen (PDR). Maar kent verder
weinig praktisch nut behalve een theoretische oefening.
Voorbeeld:
Bepaal Acceptable Audit Risk (normaliter 5 tot 10%) bij: IR = 0,37 ; CR = 0,37 ; PDR = 0,37
AAR = IR x CR x PRD
AAR = 0,37 x 0,37 x 0,37 (of 0,37^3)
AAR = 0,050653 is ongeveer 0,05 of 5%
Gedownload door: pimdl | pimdl@hotmail.com
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
€ 912 per jaar
extra verdienen?
Stuvia – Koop en Verkoop de Beste Samenvattingen
Bayesiaans Redeneren:
Bayesiaans redeneren houdt in dat kansen kunnen veranderen o.b.v. de voorkennis die wij
hebben over de populatie en mogelijk uitkomsten. We kunnen dit meenemen in onze
steekproeven.
Voorbeeld:
 Stel, we hebben een populatie van 1.000.000 inkooporders, waarbij een initiële
steekproef van N = 300 is vastgesteld
 We willen op 95% betrouwbaarheid (confidence interval) zeggen dat de populatie 99%
nauwkeurig zijn. Dus de populatie kent maar 1% fouten.
 De Accountant heeft begrepen van de IT-auditor dat de interne beheersing op orde is
en doet een proceduretest op 25 items.
 De proceduretest is dus 25 representatief voor de overige 275 foutloze
gegevensgerichte checks (300- 25)
 De foutloze steekproef van 275 mag dus MAXIMAAL 3 fouten bevatten (3 / 275 = 0,0109
of 1,09%)
 Door de initiële steekproef te verlagen van 300 naar 25, nemen we impliciet aan
dat populatie hoogstens 1,09% fouten bevat.
Data Analytics College 4 – Introductie process
mining
Datum : 28-04-2023
Subject : Data Analytics
Lecturer : M. Laghmouch
In het bedrijfsleven spreken we vaak over een bedrijf als het geheel van verschillende functies
(i.e. Marketing, financiële afdeling en operationeel). Men gebruikt hierbij middelen & partners
(Financieel, personeel, technologie en Assets) en brengt deze samen in bedrijfsprocessen
(business Processes) over meerdere afdelingen binnen de organisatie (=Organisation) om
waarde te creëeren voor de klant (=Customer)
Gedownload door: pimdl | pimdl@hotmail.com
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
€ 912 per jaar
extra verdienen?
Stuvia – Koop en Verkoop de Beste Samenvattingen
Figure 5: voorbeeld waarbij (1) Middelen worden gebruikt in (2) Bedrijfsprocessen om tot een
product/dienst te komen die waarde toevoegt voor de (3) Klant.
Een Business Process is het geheel van gestructureerde, opeenvolgende activiteiten om een
bedrijfsdoel te bereiken.
Figure 6: Voorbeeld 1 – Bedrijfsproces in de Horeca.
Bij het bepalen van of iets een bedrijfsproces is, is het goed om na te denken over:
 Wat is het doel (verkoopproces, inkoopproces, klantenservice)
 Wie zijn de ‘klanten’
 Welke waarde levert het process aan zijn ‘klanten’
 Wie zijn de ‘Key Actors’ die werkzaamheden uitvoeren binnen het bedrijfsproces?
 Zijn er alternatieve uitkomsten aan het einde – of gedurende het bedrijfsproces?
Voorbeeld – Payroll:
 Who is/are the customers? : HR, Financiéle Administratie (salarisadministratie),
personeel
 What value does the process deliver to the customer? : Betrouwbare salarisadministratie
en tijdig uitbetalen van personeel
 Who are the Key Actors of the process? : (1) Salarisadministratieur haalt nettosalarisbedrag uit applicatie en voert controle uit, (2) Hoofd HR / Financiën geeft
goedkeuring voor uitbetaling salaris
 List alternative outcomes of the process: (1) Iemand wordt wel, (2) niet, of (3)
Gedeeltelijk uitbetaald.
Automatisering binnen organisaties neemt steeds meer toe, daarom is het belangrijk om
inzichtelijk te krijgen hoe automatisering (met name IT) is geïmplementeerd binnen een
organisatie en hoe efficient processen lopen. Immers (1) Automatisering toegepast in een
organisatie met efficiënte processen vergroot de efficiency. MAAR (2) Automatisering toegepast
in een organisatie met inefficiënte processen vergroot de inefficiency van het process.
Figure 7: NIEUWE TECHNOLOGIE genereert niet direct een verhoogde business value, maar voegt waarde
toe via verbeteringen aan processen. Het faciliteert verbeteringen in processen. Deze verbetering in
bedrijfsprocessen zorgt dat het bedrijf efficiënter opereert en vergroot de klantervaring. Beiden dragen bij
aan de business value.
Gedownload door: pimdl | pimdl@hotmail.com
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
€ 912 per jaar
extra verdienen?
Stuvia – Koop en Verkoop de Beste Samenvattingen
Om te kijken hoe een organisatie presteert, is het goed te kijken of de (bedrijfs-)processen ‘in
control’ zijn. Is er een (1) Snelle doorlooptijd, (2) Hoge mate van kwaliteit en (3) Lage kosten.
Dit noemen we Business Process Management.
Traditionele Business Process Management en Datadriven Analysis (process mining)
Traditionele Business Process Management staat stil bij het waarnemen van van het
process, vaststellen of deze voldoet aan het beoogde process en te monitoren dan wel
aanpassen van process. Bij Traditionele Business Process Management is een stricte
scheiding tussen data en modellen. Het nadeel is echter dat: (1) Het model beschrijft de
ideale versie van de realiteit, het (2) Model is vanaf het verkeerde abstractieniveau en (3) Het
model is niet in staat om nauwkeurig menselijk gedrag vast te leggen.
Figure 8: Traditionele Business Process Management (L) en Process Mining (R) waarbij géén scheiding is
tussen data en het procesmodel.
Bij Traditionele Business Process Management is een mismatch tussen ideale wereld en
realiteit. Dit komt door:
 Excepties zijn overall in processen
 Processen kunnen veranderen over een langere tijdspanne
 Iedereen ziet maar één deel van het proces en niet het geheel.
De tegenhanger van traditionele BPM is Data-Driven Analyse of process mining. Process
Mining maakt met mogelijk om een gemodelleerde weergave te maken van het werkelijke
proces, gebaseerd op feiten. Dit is mogelijk door het vaststellen van een directe connectie
tussen het procesmodel- en de daadwerkelijke low-level event data over het process.
Daarnaast geeft process mining de mogelijkheid om verschillende perspectieven van dezelfde
werkelijkheid (om verschillende abstractie niveau’s) weer te geven. Traditionele BPM creert
slechts één model van het process.
Gedownload door: pimdl | pimdl@hotmail.com
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
€ 912 per jaar
extra verdienen?
Stuvia – Koop en Verkoop de Beste Samenvattingen
Figure 9: Binnen een organisatie bestaan meerdere processen (procurement, Sales process, Production
Process) welke elk leiden tot een specfiek doel (aankoop, verkoop en wijziging in voorraden). Processen
leiden tot transacties (i.e. boekingen in het Grootboek). Maar deze transacties moeten wel gecheckt
worden op nauwkeurigheid, volledigheid, tijdigheid en integriteit.
Zoals eerder besproken geeft process mining ruimte voor het bekijken van een process vanuit
verschillende perspectieven. In grote lijnen kunnen we hiernaar kijken vanuit:
 Control Flow
 Organisational
 Time
Control Flow:
Bij control flow kijken we naar hoe het process loopt o.b.v. event data. Hiervan kunnen twee
type toetsingen gedaan worden: Automated Process Discovery of vanuit event logs worden
procesmodellen opgebouwd en ontdekt zoals deze processen in de realiteit lopen.
Conformance checking is het gebruik maken van event logs om vast te stellen of het
daadwerkelijke process ook loopt zoals verwacht.
Figure 10:Links Automated Process Discovery en Rechts Conformance Checking.
Time:
Bij perspectief tijd kijken we naar de doorlooptijd van processen- en individuele processtappen.
Hiernaar kunnen gekeken worden naar Performance Mining of hoe snel een proces (of
individuele processtappen) worden doorlopen. Daarnaast hebben we het analyseren van
Seasonal patterns.
Gedownload door: pimdl | pimdl@hotmail.com
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
€ 912 per jaar
extra verdienen?
Stuvia – Koop en Verkoop de Beste Samenvattingen
Figure 11: Links – doorlooptijd van de Purchase order- en rechts het waarnemen van seizoenspatronen.
Organisational
Bij perspectief organisatie kijken we naar de samenhang van individuen/groepen/afdelingen
binnen de organisatie en/of andere entiteiten met wie men onderlinge relaties heeft. Dit om
onderlinge relaties te ontdekken. Voorbeelden hiervan zijn een social network analysis en
roles & Specializations.
Figure 12: Social Network analysis en het identificeren van Rollen en specialisaties kan nuttig zijn.
Basis van Process mining en de toegevoegde waarde binnen een
organisatie:
Process mining kan een waardevolle tool zijn omdat traditionele Business Process Management
vooral uit gaat van Confidence Based BPM (of weten hoe het process eigenlijk zou moeten
lopen), terwijl Process Mining Evidence Based BPM mogelijk maakt om te laten zien hoe het
process daadwerkelijk LOOPT. Een BPM Lifecycle (zowel traditioneel- als Process Mining) volgen
een vaste BPM Lifecylce.
Figure 13: Links, de meerdwaarde van process mining, rechts de lifecycle van BPM.
Minimale vereisten voor process mining.
Gedownload door: pimdl | pimdl@hotmail.com
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
€ 912 per jaar
extra verdienen?
Stuvia – Koop en Verkoop de Beste Samenvattingen
Voor procesmining zijn minimaal event Logs nodig of een log Boek met gebeurtenissen (of
acties) welke plaatsvinden binnen het kader van een (bedrijfs-)process. I.e.: Een inkooporder
wordt aangemaakt, inkooporder wordt goedgekeurd etc.
Om Process mining uit te kunnen voeren moet in een event log minimaal staan: Case,
Activity en timestamp. Maar wat staat er eigenlijk allemaal in een eventlog?
 Case : een iteratie of ‘instance’ van een process (i.e. Order A101)
 Activity : Een specifieke actie (i.e. levering)
 Activity Instance : een interatie of ‘instance’ van een specifieke actie (i.e. levering
1001)
 Event : Een sub-onderdeel van een activity instance (i.e. levering 1000 vertrekt uit
warenhuis)
 Timestamp : Timestamp (i.e. tijd/datum) da teen event plaatsvindt
 Resource : de persoon/afdeling verantwoordelijk voor het uitvoeren van de event
(Kees, Hans, Toon, HR, Finance etc.)
Hoewel een event en een activity instance veel op elkaar lijken, zijn er duidelijke verschillen:
Figure 14: Zie hiernaast, de blauwe blokken zijn individuele EVENTS, de Activity Instance is ‘Rood
omkaderd’.
Process Data, het ontdekken van processen met
processdata en weergave daarvan in processmodellen:
Zoals eerder opgemerkt, genereren IT-systemen binnen een organisatie data of records. Een
van deze records zijn Event Logs. Door het analyseren van deze event logs nemen we het
‘Daadwerkelijke proces’ waar. We kunnen dan bijvoorbeeld checken of het daadwerkelijke
process conform het voorgeschreven process is (zie onder). Maar voor nu focussen we op
Process Discovery of het identificeren van processen.
Figure 15: De achterliggende principes van process mining o.b.v. Process Discovery
Als we eenmaal de event-logs hebben bestudeerd moeten we deze plotten in een processmodel. Een process-model is een visuele weergave van hoe individuele activiteiten elkaar
Gedownload door: pimdl | pimdl@hotmail.com
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
€ 912 per jaar
extra verdienen?
Stuvia – Koop en Verkoop de Beste Samenvattingen
opvolgen binnen een process. Dit kan op 3 manieren: (1) Petri Nets, (2) BPMN en (3)
Process Maps.
Petri-Nets:
Petri-nets volgen een formele semantiek, zijn complex en vormen vaak de output voor
academische algoritimes.
Figure 16: Gebruik van Petri-nets
BPMN:
BPMN is eenvoudig om te gebruiken, heeft geen formele semantiek en de output is meer
bruikbaar voor het bouwen van academische algoritmes.
Figure 17: Toepassing van BPMN
Process Maps:
Process maps zijn eenvoudig in opzet, maar staan open voor meerdere interpretaties en worden
veelal gebruikt voor commerciële doeleinden.
Gedownload door: pimdl | pimdl@hotmail.com
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
€ 912 per jaar
extra verdienen?
Stuvia – Koop en Verkoop de Beste Samenvattingen
Ontdekken van processen (Process Discovery).
Process mining gebruikt een gestructureerde aanpak door te kijken naar hoe processen lopen.
Dit doen we door te kijken pér activiteit hoe activiteiten elkaar opvolgen en wat de frequentie
van individuele activiteiten is dat voorkomt in het process.
Voorbeeld:
Links zien we een abstracte weergave van een process. Hierbij zijn 3 cases te onderscheiden.
Case 1 (Groen), Case 2 (oranje) en Case 3 (blauw). In de tweede kolom zien we de activiteiten A
– E die per case worden uitgevoerd.
In het midden zien we hoe activiteiten elkaar opvolgen binnen een proces op case-basis. We
zien dat Case 1 (Groen), A-E achter elkaar doorloopt. Case 2 (Oranje) volg sequentie ACBDE en
Case 3 (blauw) voert activiteit D twee keer uit. Deze gegevens kunnen we plotten in een
procesmodel

Figure 18: Van Event-log naar een Processmodel (Petri net)
Daarnaast kunnen we individuele events vanuit de event log ook weergeven in een footprint

matrix. Dit ziet er als volgt uit:

Figure 19: # geeft een indicatie van géén relatie tussen twee acties, | | geeft een indicatie van een Loop
of parallellrelatie. En  en  geven de richting aan. Bijvoorbeeld. De relatie van A naar C is  omdat er
één pijl gaat van A naar C (zie rode kader).
Deze footprint-matrix kunnen we koppelen aan het α – Algoritme (of Alfa-algoritme).
Gedownload door: pimdl | pimdl@hotmail.com
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
€ 912 per jaar
extra verdienen?
Stuvia – Koop en Verkoop de Beste Samenvattingen
EXTRA: Alpha Algoritme
Het Alfa-Algoritme (α-algoritme) is één van de eerste algoritmes die is gebruikt voor Process Discvoery. Het
algoritme zet event-log data om naar een sequentie van events die een petri-net vormen. Het Alfa algoritme volgt
dezelfde 3 regels als de Footprint-Matrix
 Temporal Dependency : dit betekent dat er een vaste volgorde is tussen
processtappen. Event A wordt altijd gevolgd door Event B. Maar event B, kan niet
plaatsvinden zonder Event A. Dit wordt weergegeven (net als in de footprint matrix)
met symbolen ‘’ of ‘’
 Temporal Independency: dit betekent dat er een wederkerige relatie is tussen
events. Event A wordt gevolgd door Event B. Maar B kan ook weer terug gaan naar
event A. Deze relatie wordt aangeduidt met een “| |” symbool
 Independence: : Dit betekent dat er géén relatie bestaat tussen events. Event A
wordt dus niet gevolgd door Event B en hebben geen verdere relatie met elkaar.
Dit wordt aangeduid met een “#”
Het alpha algoritme ziet er als volgt uit:
(1) Definieer Alle events
(2) Definieer alle starting events
(3) Definieer alle end events
(4) Bepaal/calculeer alle mogelijkheden tussen A & B
(5) Drop non-maximum sets
(6) Create places for all derived sets and Add start + end state
(7) Draw connections
(8) Return petri-net.
Gedownload door: pimdl | pimdl@hotmail.com
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
€ 912 per jaar
extra verdienen?
Stuvia – Koop en Verkoop de Beste Samenvattingen
Herkennen van processen (Conformance Checking):
Nadat we Process Discovery hebben besproken, bespreken we nu conformance checking of
het gebruiken van process mining om vast te stellen of het daadwerkelijke process aansluit op
het beoogde/geformaliseerde process zoals is beschreven in procesdocumentatie.
Figure 20: Process conformance check:
Een proces is conform het daadwerkelijke verloop overeenkomt met de
geplande/geformaliseerde verloop. Hiervoor zijn aanpakken zoals: Coarse Approach, Token
based approach, Footprint Matrix approach, Alignment Based en rule-based
approach.
Coarse Approach:
Figure 21: Bij deze methode gaan we iteratief af, welke combinaties er mogelijk zijn dat processtappen
elkaar kunnen opvolgen. I.e Stap A direct naar stap D kan niet, want het proces volgt altijd stap A  Stap
A of B en dan Stap D. Het percentage van processen die dit schema kan volgen is de fitness rate.
Gedownload door: pimdl | pimdl@hotmail.com
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
€ 912 per jaar
extra verdienen?
Stuvia – Koop en Verkoop de Beste Samenvattingen
Token-Based Approach:
Figure 22: Voorbeeld van de 5 iteraties (P=5), was er 1 instance (m=1) waar een token NIET verwerkt kon
worden. De overige 4 (C=4) zijn geconsumeerd en kunnen het hele proces volgen. Er blijven 0 iteraties
over (r=0)
Token-Based Approach:
Gedownload door: pimdl | pimdl@hotmail.com
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
€ 912 per jaar
extra verdienen?
Stuvia – Koop en Verkoop de Beste Samenvattingen
Figure 23: Vergelijkbaar met coarse approach, stelt vast hoeveel cellen een corresponderend pad volgen.
Allignment methode:
Deze methode vergelijkt elke ‘move’ of processtap in een aaneenschakeling van processtappen
(i.e. Trace). De output is op een zeer gedetaileerd niveau omdat het iets zegt over nieuwe
ingebrachte activiteit, of een activiteit die is overgeslagen.
Noteren van relaties in een model.
Voor het noteren van een model zijn twee methodes toegestaan: Procedural Model en een
declarative model. Waarbij een procedural model vooral (visueel) inzichtelijk maakt hoe
processtapen lopen terwijl Declarative model dieper in gaat op de onderliggende business
rules d.m.v. een If … Then statement of een voorwaarde (i.e. Als er 2de goedkeuring is voor
ontvangen goederen- is er een 1ste goedkeuring voor ontvangen goederen).
Gedownload door: pimdl | pimdl@hotmail.com
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
€ 912 per jaar
extra verdienen?
Stuvia – Koop en Verkoop de Beste Samenvattingen
Beperkingen van een model:
Het probleem is dat een model in verschillende vormen en maten komt. Hierdoor is niet elk
procesmodel een geschikte weergave van een proces. Belangrijke voorwaarden voor een goed
algoritme zijn Fitness (event logs sluiten aan op het model), simplicity (eenvoud is belangrijk)
evenals generaliseerbaarheid (model is niet ‘ overfitting’ de event log) en precision (model
is niet underfitting de log). Een model is maar een model, het bouwen van een procesmodel
wordt dan ook gezien al seen kunst. Maar elk model heeft zijn eigen limitaties/beperkingen. Een
goed model raakt 4 criteria: Passendheid (fitness en toont alle data/model is representatief voor
dataset), Eenvoud (simplicity), Generaliseerbaarheid (generalisation) en precisie (precision).
Binnen deze 4 voorwaarden moeten we iets begrijpen:
Figure 24: Gebeurtenissen in de wereld worden vastgelegd (record) in Event Data. Bij de Process
discover approach proberen we middels deze event data een proces model te ontdekken (Discover). Het
Gedownload door: pimdl | pimdl@hotmail.com
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
€ 912 per jaar
extra verdienen?
Stuvia – Koop en Verkoop de Beste Samenvattingen
hebben van een correct en nauwkeurig Proces Model helpt ons om de wereld waarin we leven te
begrijpen en te analyseren (understand & Analyse).
Figure 25: Om terug te komen op onze 4 criteria. We willen dat het process model 1. alle (Fitness) en 2.
alleen de (precision) event data weergeeft. Daarnaast willen we dat het proces model eenvoudig is om 3.
Uit te leggen (simplicity) en willen we dat het procesmodel iets zegt over de 4. wereld en/of iets in de
wereld uitlegd (generalization)
Process Mining in Auditing:
Process mining heeft nog veel ruimte te winnen binnen auditing. Hoog over zouden we process
mining als volgt in kunnen zetten:
 Audit Planning:
Binnen de audit planning gaat het vooral om het herkennen van processen, dit kan o.b.v.
een gestructureerd of een ongestructureerd proces.
Gedownload door: pimdl | pimdl@hotmail.com
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
€ 912 per jaar
extra verdienen?
Stuvia – Koop en Verkoop de Beste Samenvattingen
Figure 26:Gestructureerd (links) of ongestructureerd (rechts) proces.
 Planning of the process audit
Ook hier is process discovery belangrijk maar vooral de
o process logica: (1) Is het proces zoals we hadden verwacht? (2) Welke
processtappen worden zichtbaar uitgevoerd op verschillende abstractieniveaus?
(3) Zijn er niet veel voorkomende relaties tussen activiteiten.
o Conformance check: welke algemene inzichten hebben we in excepties van het
process? Zijn er verklaringen voor deze excepties? Hoe verlopen de processen in
relatie tot het procesmodel?
 Audit execution
In deze stap wordt een check gedaan met relatie tot de onderliggende ‘rulesets’, een
analyse gemaakt in varianten van het process en een case-analysis gemaakt voor
specifieke afwijkingen.
o We checken de event log in meer detail door het uitvoeren van een 2de
conformance check en bestuderen van Varianten en case-analyse
 Results communication
In deze stap geven we een visuele weergave van onze analyse om ana te tonen hoe het
process verloopt, waar excepties zijn en wat de oorzaak van deze excepties was.
 Follow-up:
Voor external auditors wordt process mining ook belangrijker want door de introductie van een
aanpassing in ISA 315, identifying and assessing the risks of material misstatement
moet de auditor inzicht krijgen in de entiteit en haar business- en IT-omgeving. Hieronder vallen
dus ook bedrijfsprocessen (of dagelijkse business). Hierbij zouden we kunnen bouwen op de
analyses uitgevoerd door de internal auditor. We checken de structuur van een event log,
checken de systemen die zijn gebruikt voor het genereren van event logs en we checken de
analyses uitgevoerd door de auditor.
Data Analytics College 5 & 6 – Introductie Disco
& process mining als een proces
Datum : 28-04-2023
Subject : Data Analytics
Lecturer : M. Laghmouch
Een Process-mining project doorloopt verschillende fases waarbij verschillende werkzaamheden
worden uitgevoerd. Hoogover doorloopt men 6 fases: (1) Planning, (2) Extractie, (3) Data
Processing, (4) Mining & Analysis, (5) Evaluation en (6) Process improvement & Support
Gedownload door: pimdl | pimdl@hotmail.com
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
€ 912 per jaar
extra verdienen?
Stuvia – Koop en Verkoop de Beste Samenvattingen
Figure 27: Het totale proces van process mining
 Planning:
De eerste stap is het opzetten van een project door (1) Het selecteren van
bedrijfsprocessen, (2) O.b.v. de geïdentificeerde bedrijfsprocessen bedenken we
onderzoeksvragen en (3) We stellen een projectteam samen.
 Extractie:
Om data mining uit te voeren, hebben we event data nodig. Daarbij bepalen we het
volgende: (1) De reikwijdte van het onderzoek (en dus de dataset). Binnen de scope
denken we na over: Granulariteit, welke onderzoeksperiode en welke data-attributen
moeten worden geraakt. Daarna gaan we over tot (2) Data extractie van de event
data.
 Data Processing:
De dataset wordt voorbereid om ervoor te zorgen dat deze optimal bruikbaar is voor het
maken van analyses. Denk hierbij aan: Create views, enrich logs, aggregate events en
filter logs.
 Mining & Analysis:
We passen verschillende process-mining technieken toe om een antwoord te krijgen op
onze onderzoeksvragen.
Gedownload door: pimdl | pimdl@hotmail.com
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
€ 912 per jaar
extra verdienen?
Stuvia – Koop en Verkoop de Beste Samenvattingen
 Evaluation:
N.a.v. de analyse komen bevindingen naar boven. Deze bevindingen kunnen leiden tot
verbeteringen voor de organisatie. Denk hierbij aan stappen zoals: Diagnose maken van
bevindingen, Verifieren van uitkomsten en valideren van bevindingen bij management.
 Process Improvement & support:
We passen onze uitkomsten toe om zo het huidige process te wijzigen naar de gewenste
situatie. Door het implementeren van verbeteringen en support operations.
Gedownload door: pimdl | pimdl@hotmail.com
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
€ 912 per jaar
extra verdienen?
Stuvia – Koop en Verkoop de Beste Samenvattingen
Data Analytics College 7 – Van relationele
database naar event log
Datum : 12-05-2023
Subject : Data Analytics
Lecturer : M. Jans
In college 5 & 6 hebben we stil gestaan bij hoe een Process mining project verloopt. We hebben
hier gezien dat een voorwaarde voor een Process Mining project, goede event data is. Deze
event data is vaak niet direct beschikbaar als een ‘kant-en-klare’ dataset. Event-logs worden
vaak bijgehouden als onderdeel van een relationale Database (i.e. welke transacties zijn
uitgevoerd). Maar kunnen worden opgehaald uit een DBMS.
Figure 28: Veel event data komt uit een DBMS. Voordat een process-mining project begint, vindt de
planningsfase plaats (zie college 5 & 6). Hierna wordt een data-extractie gedaan op de DBMS om tot de
event data te komen. Deze data is vaak nog niet direct klaar om verwerkt -en geanalyseerd te worden.
Hiervoor moet data worden geschoond en in format worden gezet waarmee process miners kunnen
werken. Dit is de stap data processing. Zodra de data klaar voor gebruik is wordt process mining
toegepast om processen te ontdekken- of te toetsen of deze conform procesbeschrijvingen lopen.
Bij de data-extractie van een relationele Database, en de transformatie naar waardevolle
event-log data draait het om keuzes: Wat wil de miner weten? Voor wie is de data bedoeld? De
term Database verwijst normaliter een een relationele Database Management System
(RDBMS), waarbij records/transacties op individueel niveau zijn vastgelegd- en worden
gerelateerd aan elkaar via relaties of indicen in tabellen.
Voorbeeld : Purchase to pay proces
Figure 29: In de eerste fase stellen we vast: (1) Welke proces(sen) we gaan analyseren, (2) we stellen het
doel van de process-mining project vast. Dit is is Efficiency (Process Discovery) of Compliance (process
conformance). En vervolgens stellen we vast wie de stakeholders zijn. Door te bepalen wie de
stakeholders zijn (i.e. internal auditor, manager, afdeling crediteuren/incoop) kunnen we identificeren wat
hun informatiebehoeft is EN DUS welke informatie de stakeholder uit het process mining project wil halen.
Gedownload door: pimdl | pimdl@hotmail.com
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
€ 912 per jaar
extra verdienen?
Stuvia – Koop en Verkoop de Beste Samenvattingen
Figure 30: Vervolgens stellen we vast wat de Process Cornerstones zijn binnen het proces. Process
Cornerstones zijn events/processtappen die essentieel zijn voor het overall process (i.e. aanmaken van
een Purchase Requisition, aanmaken van purchase order, goedkeuren Purchase order, ontvangen
goederen, boeken factuur en betaling). Goede vragen bij dit voorbeeld zouden kunnen zijn: is voldoende
SoD (Segregation of Duties of controletechnische functiescheiding) tussen de PO aanmaken en ontvangst
goederen? is er SOD tussen 2 niveaus van approval Purchase order? Is er voor elke factuur ook een
purchase order om te herleiden?
Figure 31: Nadat we alle cornerstones binnen een Process hebben bepaald, is het belangrijk dat we
kunnen bepalen (1) Welke informatie wordt gecreëerd binnen elke cornerstone en (2) cornerstones
terugzien als individuele ‘events’ binnen de event logs.
Belangrijk om op te merken: Er is géén simpele tabel binnen een Database Management System
waarin alle event logs vastliggen met bijbehorende timestamps (tijd/datum activiteit). De Miner
dient zelf deze event log data te vinden. Het is dan ook belangrijk om te weten voor een cornerstone
in welke relationele tabel binnen de database deze timestamps te vinden zijn. Daarnaast willen we
weten hoe documenten en tabellen binnen de database met elkaar samenhangen zie onder:
Figure 32: We kunnen de timestamp voor een aangemaakte Purchase Order (create a Purchase Order)
vinden in de PO-header. Voor geboekte facturen kunnen we de timestamp vinden in de invoice header
etc.
Vervolgens willen we weten hoe de relaties lopen binnen de database. Welke tabellen zijn met
elkaar gerelateerd? Hoe lopen deze relaties ? En verhouden tabellen zich met elkaar (i.e. is één
tabel aan één andere tabel gerelateerd als one-to-one, of is één tabel aan meerdere tabellen
gerelateerd als many-to-many?)
Dit doen we door een Entity-Relation of E-R diagram. Zie hiervoor de volgende pagina.
Gedownload door: pimdl | pimdl@hotmail.com
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
€ 912 per jaar
extra verdienen?
Stuvia – Koop en Verkoop de Beste Samenvattingen
Voor de 4de stap spreken we over process instances of het object dat je gaat volgen door het
gehele process en welke is onderworpen aan process activiteiten. In document-gebaseerde
processen (i.e. het inkoopproces) wordt vaak de instance gerelateerd aan één of meer
documenten.
Microsoft Visio – Intermezzo
Microsoft Visio, maakt binnen het E-R Model gebruik van de Crowsfoot notering, hierbij worden
de volgende symbolen gebruikt:
Symbool: Betekenis:
Relaties (Cardinality & Modality)
Relatie cardinality = 1
Relatie modality = 0 e.g. Max is 1 , min is 0
Relatie cardinality = ∞ / onbekend
Relatie modality = 1 e.g. Max is meerdere, min is 1
Relatie cardinality = 1
Relatie moality = 1 e.g. Max is 1, min is 1
Relatie cardinality = ∞ / onbekend
Relatie modality = 0 e.g. Max is meedere , min is 0
Many-to-one
VAN Relatie cardinality ∞ / onbekend & modality = 1
NAAR relatie cardinality = 1 & modality = 1
VAN Relatie cardinality ∞ / onbekend & modality = 0
NAAR relatie cardinality = 1 & modality = 1
VAN Relatie cardinality ∞ / onbekend & modality = 1
NAAR relatie cardinality = 1 & modality = 0
VAN Relatie cardinality ∞ / onbekend & modality = 0
NAAR relatie cardinality = 1 & modality = 0
Many-to-many
VAN Relatie cardinality ∞ / onbekend & modality = 1
NAAR relatie cardinality = 1 & modality = 1
VAN Relatie cardinality ∞ / onbekend & modality = 1
NAAR relatie cardinality = 1 & modality = 1
VAN Relatie cardinality ∞ / onbekend & modality = 1
NAAR relatie cardinality = 1 & modality = 1
VAN Relatie cardinality ∞ / onbekend & modality = 1
NAAR relatie cardinality = 1 & modality = 1
VAN Relatie cardinality ∞ / onbekend & modality = 1
NAAR relatie cardinality = 1 & modality = 1
Bron: https://www.conceptdraw.com/How-To-Guide/erd-entity-relationship-diagram-symbols
NOTE: bij many to one & Many-to-many bij bijvoorbeeld:
De bovenstaande “Crowsfoot” moeten we lezen als: “1- of meer entiteiten A, staan in relatie
tot 1 entiteit B” bijvoorbeeld: 1- of meer verschillende truien (entiteit A) worden verkocht
door 1 H&M-winkel (entiteit B). De relatie hier is many-to-one.
Gedownload door: pimdl | pimdl@hotmail.com
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
€ 912 per jaar
extra verdienen?
Stuvia – Koop en Verkoop de Beste Samenvattingen
Nadat we vaststellen welk document (i.e. Purchase Order) we volgen, dan is de volgende stap
om te bepalen welk granuliteit (detailniveau) we aanhouden, we kiezen hierin tussen (1)
Process instance niveau en (2) Transactie niveau. De granularity is de mate van detail in
een data-structuur.
Nadat we de cornerstones hebben bepaald, o.b.v. de cornerstones de timestamps hebben
opgehaald uit de verschillende tabellen die met elkaar in relatie staan. Gaan we over naar het
selecteren van activiteiten binnen een process- en de onderliggende data per proces.
Gedownload door: pimdl | pimdl@hotmail.com
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
€ 912 per jaar
extra verdienen?
Stuvia – Koop en Verkoop de Beste Samenvattingen
Hier kiezen we tussen case Attributes (Attributen per specifieke Case of Bedrijfstransactie
binnen een IT-systeem) of Event attributes (Attributen gerelateerd aan een specifieke event).
De afweging is hierbij hoe men het process wil weergeven:
Figure 33: Links zien we de uitwerking van het purchase-to-pay process op CASE basis we volgen dus
één specifieke transactie en volgen deze gedurende het proces. Rechts zien we de processen op event
niveau.

 • TIPS:
 • Lees eerst de casus
 • Bepaal de goal, waarin is de persoon geïnteresseerd, wie zijn de stakeholders (i.e.
  geïntereseerden)
 • Daarom kies ik deze processes instances
 • Ik heb het E-R diagram getekend, om vast te stellen hoe relaties tussen tabellen lopen
 • Van cornerstones naar timestamp
 • Selecteren van een process instance
 • Identificeren van activiteiten- en de daarbijhorende attributen opzoeken.
  Gedownload door: pimdl | pimdl@hotmail.com
  Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
  € 912 per jaar
  extra verdienen?
  Stuvia – Koop en Verkoop de Beste Samenvattingen
  Data Analytics College 9 – Data Analytics
  Datum : 26-05-2023
  Subject : Data Analytics
  Lecturer : Bert-Jan Butijn
  NB: Het tentamen gaat alleen over de colleges van process mining. Data analytics
  wordt getoetst o.b.v. de casus.
  Data Analytics is een verzamelnaam voor verschillende analytische technieken om data te
  analyseren. Data analytics kan voor verschillende doeleinden worden gebruikt. Het hoeft niet
  per se voor alleen controle gebruikt worden- maar kan ook worden gebruikt om extra inzichten
  te krijgen. Denk aan bijvoorbeeld:
   In kader van de jaarrekening:
  o Begrijpen van de industrie en business van de klant
  o Achterhalen going-concern klant
  o Achterhalen mogelijke onjuistheden in de jaarrekening
  o Genereren van bewijs ter ondersteuning van balans
   In het kader van IT-audit:
  o Analyseren van de gebruikerslijsten
  o Analyseren van log-files / incident rapporten
  Data is gegegevens (numeriek of non-numeriek). Data krijgt pas een toegevoegde waarde
  wanneer deze wordt geanalyseerd om relaties te herkennen die een logisch verband kennen.
  Dan pas kan het worden omgezet naar Informatie.
  Voorwaarden voor implementeren van Data analytics:
   In de test data moeten alle relevantie condities zitten die je wilt testen
   De test data gebruikt door de auditor moet dezelfde zijn als die gebruikt door de client
  gedurende het jaar
   De testdata moet niet de data van de klant beinvloeden (i.e. continuiteit)
  Voorwaarden voor het kunnen uitvoeren van Data analytics:
   De data is geschoond (i.e. mapping, lege cellen)
   De data moet volledig, uitputtend en nauwkeurig zijn (Information Provided By Entity of
  IPE).
   De integriteit van de input is gegarandeerd
  o Wie kan er bij de data / wie heeft toegang in de DBMS?
  o Wie kan er wijzigingen doorvoeren?
  o Wie kan directe datawijzigingen?
   Er is goed zicht op de processen die het informatiesysteem volgt om input data naar
  output data te converteren
   Een methodologie van de analyse is reproduceerbaar (Documenteren van testprocedure)
  Kenmerken van Data
  Primitieve typen: Voorbeeld:
  Byte: -128 to 128
  Integer (Hele getallen) 0,1,2,3,4,120
  Float (Decimalen) 1.08, 6.977 8,955
  Boolean True, False
  Character “A”, “a” etc.
  Complexe typen: Voorbeeld:
  String (tekst) “Hello World”
  Array [“Hello”, “World”]
  Gedownload door: pimdl | pimdl@hotmail.com
  Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
  € 912 per jaar
  extra verdienen?
  Stuvia – Koop en Verkoop de Beste Samenvattingen
  Class (Object) (Object heeft attributen zoals
  naam & leeftijd)
  Class Person:
  Def_init_(self,name,age):
  Self.name = name
  Self.age = age
  P1 = Person (“John”,36)
  File-typen:
  o XML
  o JSON
  o .csv
  o .xlsx
  o .html
  o .txt
  Tools:
  o R
  o Python
  o Excel
  o Alteryx
  o Power BI
  o Tableau
  o RapidMiner
  Gedownload door: pimdl | pimdl@hotmail.com
  Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
  € 912 per jaar
  extra verdienen?
  Stuvia – Koop en Verkoop de Beste Samenvattingen
  Auditing and Assurance Services (international perspective)
  (17th Edition)
  By: Elder, Beasley, Hogen Arens
  NB: Deze sectie is bedoeld als een recap voor hoofdstukken 5 – 8 en 16.1 – 16.3 als
  onderdeel van colleges 1 & 2 en is dus geen volwaardige samenvatting.
  Hoofdstuk 5 – Audit responsibilities and objectives (118 – 152)
  De AICPIA Auditing standards definiëren het doel van de audit als:
  ‘to provide financial statement users with an opinion by the auditor on whether the financial
  statements are presented fairly, in all material respects, in accordance with the applicable financial
  accounting framework.’
  Beurs geregistreerde bedrijven publiceren hun jaarrekening voor aandeelhouders of andere stakeholders.
  Management van het bedrijf is belast met het ervoor zorgen dat het (1) bedrijf passende accounting-beleid
  voor externe verslaggeving zijn geïmplementeerd (2) Het bedrijf zorgt voor een nauwkeurige weergave van
  de financiële situatie van het bedrijf en (3) Voldoende internal control. De Auditor is echter belast met het
  controleren van de jaarrekening. De verantwoordelijkheid van de auditor is het opsporen/waarnemen van
  material misstatements (due to error or fraud).
   We spreken over een material misstatement als het geheel van onaangepaste fouten in de jaarrekening
  naar waarschijnlijkheid een invloed heeft gehad op de beslissingen van de gebruiker van de jaarrekening
  (i.e. aandeelhouder). Anders spreken we over immaterial misstatement, de fout is dan niet materieel.
   De auditor levert nooit absolute assurance maar reasonable assurance (of een redelijke mate van
  assurance). We leveren een redelijke mate i.p.v. absolute assurance omdat:
 1. Meeste audit evidence komt uit het testen van een sample uit een (grote populatie), hierdoor
  bestaat het risico dat door sampling we mogelijk de material misstatement niet hadden kunnen
  waarnemen (i.e. sampling risk).
 2. Financiële weergaves in accounting bevatten schattingen waardoor er onzekerheid ontstaat
  over de waarde van een goed/asset in de toekomst.
 3. Fraude is vaak lastig te detecteren binnen de jaarrekening, vooral als sprake is van
  samenzwering tussen management en derde partijen.
  Tijdens een audit krijgt de auditor mogelijk te maken met onopzettelijke fouten (Errors) of opzettelijke
  fouten (Fraud), de auditors-standaarden (waar een auditor zich aan moet houden) maken hier geen
  onderscheid onder. In beide gevallen moet de auditor voldoende audit-procedures uitvoeren om deze
  fouten waar te nemen- of te kunnen vaststellen met een redelijke mate van zekerheid dat de jaarrekening
  vrij van deze fouten was. Tijdens deze werkzaamheden maakt de auditor gebruik van professional
  skepticism welke bestaat uit: Questioning mindset, suspension of judgement, search for knowledge,
  interpersonal understanding, autonomy en self-esteem.
  Binnen een financial statement audit, maakt men gebruik van ‘cyclussen’ dit zijn bedrijfsprocessen die
  direct gerelateerd zijn aan de jaarrekening. Denk hierbij aan: Voorraadbeheer, verkoopcyclus, inkoopcyclus,
  payroll en personeel en het verkrijgen en/of terugbetalen van kapitaal (i.e. leningen). Bij aanvang van de
  audit worden ‘audit-objectives’ gedefinieerd. Denk hierbij aan transaction-related audit objectives en
  Balance-related audit objectives. Bij het vaststellen van deze objectives gaat de auditor dit testen door het
  verzamelen van bewijslast. Op basis van de objectives doorloopt de auditor 4 fases:
 4. Plan and design audit approach, baesd on risk assessment procedures
 5. Perform test of controls and substantive tests of transactions
  Gedownload door: pimdl | pimdl@hotmail.com
  Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
  € 912 per jaar
  extra verdienen?
  Stuvia – Koop en Verkoop de Beste Samenvattingen
 6. Perform substantive analytical procedures and tests of details of balances
 7. Complete the audit and issue the audit report.
  Hoofdstuk 6 – Audit evidence (153 – 194 )
  Audit bewijslast of evidence is ‘elke’ vorm van informatie gebruikt door de auditor om aan te tonen dat de
  jaarrekening (met een redelijke mate van zekerheid) geen afwijkingen bevat en dus juist is weergegeven.
  Bewijslast bevat ‘highly persuasive’ informatie zoals documentatie, observaties en minder ‘persuasive’
  informatie zoals interviews of responses.
  Wanneer men een audit uitvoert moet men als eerste nadenken over de juiste hoeveelheid & type
  bewijslast, om aan te tonen dat de Jaarrekening (hierna JR) was correct weergegeven. Om tot de conclusie
  te komen hoeveel bewijslast- en welke type bewijslast verzameld moet worden, moet men 4 vragen
  stellen:
   Welke audit procedures gaan we gebruiken?
   Wat is de sample-grootte , gegeven de audit procedure?
   Welke ‘items’ selecteren we uit de populatie?
   Wanneer voeren we de audit-werkzaamheden uit?
  Met een (1) audit procedure noemen we de werkzaamheden die verricht moeten worden om audit
  evidence te verzamelen tijdens de audit (i.e. het vergelijken van journaalsposten of het opvragen van de
  populatie van IT-incidenten gedurende het halfjaar). Hierna bepalen we (2) de sample size of
  steekproefgrootte, deze is afhankelijk van de grootte van de populatie en verschilt per audit. Nadat we de
  steekproefgrootte hebben bepaald (3) selecteren we individuele items uit de populatie om te testen. (4)
  Veel bedrijven willen hun jaarrekening af binnen 3-maanden na het aflopen van het fiscale jaar. Hiermee
  moet dus ook rekening gehouden worden tijdens de selectie van samples.
  De audit standaarden eisen van de auditor dat deze voldoende (relevante) informatie verzameld als bewijs
  om tot een weloverwogen oordeel te komen over de jaarrekening. Bewijslast moet persuasive zijn en kan
  dus worden uitgesplitst in appropriateness en sufficiency van bewijslast:
   Appropriateness is de mate van kwaliteit van bewijslast, hieronder vallen de relevantie van
  bewijslast (i.e. is het relevant voor de jaarrekening) en de betrouwbaarheid van bewijslast )i.e. de
  mate waarin bewijslast geloofwaardig en betrouwbaar is). Betrouwbaarheid is verder afhankelijk
  van: independence of provider, effectiviness of client’s internal controls, Auditor’s direct knowledge,
  qualifications of individuals providing the information, degree of objectivity, timliness.
   Sufficiency is de mate van kwantiteit van bewijslast, is voldoende informatie verzameld om iets te
  kunnen zeggen?
  Audit evidence komt in verschillende soorten, types en maten. Denk hierbij aan:
   Fysieke inspectie van fysieke goederen, (schriftelijke)bevestiging van een derde partij, inspectie van
  documentatie, analytische procedures, interviews met de klant, opnieuw uitvoeren van
  berekeningen, opnieuw uitvoeren van processen en observatie. Elke vorm van evidence heeft een
  andere mate van appropriateness.
  Tijdens de audit kan gebruik worden gemaakt van analytical procedures. Deze mogen worden ingezet (1)
  Tijdens de planningfase (als onderdeel van risk assessment), (2) Tijdens de testingfase als een substantive
  test en (3) Tijdens de afrondingsfase als een vorm van final review. De auditor maakt tijdens deze
  analytische procedures vaak de vergelijking. Dit kan op een aantal manieren:
   Vergelijking o.b.v. benchmarks / industrie data
   Vergelijking o.b.v. huidig jaar t.o.v. vorig jaar
   Vergelijking o.b.v. geschatte resultaten bepaald door de klant
   Vergelijking o.b.v. geschatte resultaten bepaald door de auditor.
  Gedownload door: pimdl | pimdl@hotmail.com
  Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
  € 912 per jaar
  extra verdienen?
  Stuvia – Koop en Verkoop de Beste Samenvattingen
  Hoofdstuk 7 – Audit planning and materiality (195 – 233 )
  Volgens de amerikaanse audit-standaarden moet een auditor zijn werk correct plannen en genoeg toezichthouden
  door het werk wat wordt uitgevoerd door het team. Goede planning is belangrijk omdat: (1) De auditor moet
  ‘sufficient appropriate’ evidence verzamelen binnen een beperkte tijd, (2) De kosten blijven beperkt voor de klant en
  (3) Er ontstaan geen mistverstanden met de klant over het opgeleverde werk. De planningfase bestaat grofweg uit 8
  stappen:
   Klantacceptatie & initiële audit planning
   Understand the business
   Uitvoeren van voorlopige analytische procedures
   Bepalen van materialiteit en performance materiality
   Identificeren van ‘significante’ risico’s m.b.t. fraude of fouten
   Beoordelen van inherent risk
   Begrijpen hoe de internal control is ingericht en bepaal control risk
   Afronden van audit strategie en audit plan.
  Belangrijke termen hierbij zijn:
   Acceptable Audit risk: de mate waarin een auditor risico wil accepteren dat na het publiceren van de
  jaarrekening, deze toch een material misstatement bevat.
   Client Business Risk: het risico dat de entiteit niet zijn doelen/strategie kan verwezelijken. Dit risico ligt
  volledig bij de klant (i.e. economische malaise, te hoge kostprijs) en staat volledig los van de jaarrekening,
  maar kan hier wel invloed op hebben (i.e. verminderde verkopen)
   Risk of material misstatement: het risico dat de JR een material misstatement bevat.
  Tijdens de planningsfase moet de auditor gebruik maken van ‘preliminary analytical procedures’ als onderdeel van de
  risk-assessment. Een voorbeeld hiervan is het analyseren van financiële ratios. Nadat we begrijpen in welke industrie
  de klant zich bevindt, welk verdienmodel ze hebben, welke bedrijfsprocessen ze hebben en analytische procedures
  hebben uitgevoerd bepalen we de materialiteit of de grootte van misstatements individueel- of samen met andere
  misstatements, die invloed kunnen hebben op de beslissingen van de gebruiker van de JR op basis van deze foutieve
  informatie. Bij het bepalen van de materialiteit doorloopt de auditor 5 stappen (zie tevens afbeelding hieronder):
 8. Het bepalen van de materialiteit voor de gehele JR
 9. Het bepalen van de materialiteit van individuele segmenten van de audit (i.e. klassen transacties,
  journaalposten of andere vastleggingen). Dit noemen we de performance materiality.
 10. Het bepalen van de totale misstatement individueel segment
 11. Schat het totaal van misstatements
  Gedownload door: pimdl | pimdl@hotmail.com
  Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
  € 912 per jaar
  extra verdienen?
  Stuvia – Koop en Verkoop de Beste Samenvattingen
  Performance materiality is de hoeveelheid misstatement voor een segment binnen de jaarrekening. Welke lager is
  dan de materialiteit voor de gehele JR. Het vaststellen van performance materiality is gebaseerd op professional
  judgement en geeft weer de hoeveelheid ‘misstatement’ dat een auditor maximal wil accepteren binnen een segment.
  Zoals eerder besproken kan een segment een balanspost zijn. Een alternatieve naam voor performance materiality is
  tolerable misstatement.
  Hoofdstuk 8 – Assessing the risk of material misstatement (234 – 266)
  Een auditor accepteert een mate van risico of onzekerheid in zijn werkzaamheden. Dit noemen we het audit risk. Hij
  loopt het risico dat er sprake is van een (1) Material misstatement at overall financial statement level of (2) Material
  misstatement at the assertion level. N.a.v. deze risico’s zal de auditor dan ook een risk-assessment moeten uitvoeren
  om vast te stellen wat het risico van material misstatement is door fraude en/of fouten. Hiervoor kan de auditor
  procedures doorlopen zoals:
 12. Interview met management en anderen binnen het bedrijf
 13. Analytische procedures
 14. Observatie en inspectie
 15. Discussies over gelopen risico met engagement-members
 16. Andere risk-assessment procedures.
  Omdat we een oordeel geven of de JR vrij is van een material misstatement ‘due to error or fraud’ moeten we ook
  nadenken over frauderisico. In de praktijk is het risico dat een misstatement door een fout onopgemerkt blijft voor de
  auditor (detection risk) laag. Omdat veel fraude’s vaak complex en verfijnd zijn is dus het risico dat een misstatement
  door fraude onopgemerkt blijft hoog! Daarom moet de auditor aanvullende werkzaamheden doen m.b.t. frauderisico.
  Denk hierbij aan: het verzamelen van informatie van management hoe om wordt gegaan met fraude.
  Om vast te stellen hoeveel evidence een auditor moet verzamelen, kan deze gebruik maken van het audit risk model
  de bestaat uit een aantal elementen:
  Planned Detection Risk ( PDR)=
  Acceptable Audit Risk( AAR)
  Inherent Risk ( IR) ×Control Risk (CR)
  Planned Detection Risk : het risico dat audit evidence niet voldoende is om misstatements te ontdekken die boven
  de performance materiality zijn – of de auditor niet in staat is de material misstatement te
  ontdekken
  Inherent Risk : het risico dat er een material misstatement is in de JR voordat de effectiviteit van internal
  controls is beoordeeld (i.e. het ‘bruto-risico’ voordat internal controls zijn
  geïmplementeerd)
  Control Risk: : het risico dat de internal controls van de klant neit in staat zijn om misstatements waar te
  nemen of te voorkomen.
  Stap 1
  Bepaal materialiteit voor de gehele
  jaarrekening
  Stap 2
  Bepaal materialiteit voor elk individueel segment van de
  jaarrekening (performance materiality)
  Stap 3
  Schat de totale misstatement per segment
  Stap 4
  Schat de totale misstatement
  Stap 5
  Vergelijk het geschatte totale misttatement met de
  materialiteit en pas deze als zodoende aan
  Planning mate
  van testing
  Evalueren van
  resultaten
  Gedownload door: pimdl | pimdl@hotmail.com
  Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
  € 912 per jaar
  extra verdienen?
  Stuvia – Koop en Verkoop de Beste Samenvattingen
  Audit risk: : het risico dat deauditor een onjuiste opinie geeft, wanneer toch een materiële
  misstatement blijkt te zijn.
  Bijvoorbeeld:
  IR = 100%
  CR = 100%
  AAR = 5%
  PDR = ?
  Planned Detection Risk ( PDR)=
  0,05
  1,0∗1,0
  =0,05 of 5%
  Naarmate het Audit Risk risico toeneemt (i.e. we willen de detection risk zo laag mogelijk) heeft dit effect op de
  auditor. Een auditor reageert hierop door te kijken naar de mate van testing (hoeveel samples, hoe diepgaand moeten
  we testen? Welke evidence?) maar ook de type procedures die worden uitgevoerd. Een hoger risico van audit risk kan
  bijvoorbeeld betekenen:
   Dat de auditor meer ervaren staff in zijn team wil hebben
   De engagement wordt vaker gereviewd (i.e. internal quality review) dan normal.
  Hoofdstuk 16 – Audit sampling for test of details of balances (526 – 545)
  (let op : alleen 16.1 – 16.3)
  Tijdens het uitvoeren van testprocedures, moet de auditor correct sampling toepassen om te voorkomen dat hij een
  verkeerde conclusie trekt over de populatie.
  16.1 – audit sampling voor test of details (TOD), Test of Controls (TOC) en Substantive Testing.
  Bij zijn testwerkzaamheden, wil de auditor o.b.v. een sample een conclusive trekken over de gehele populatie.
  Hiervoor is het dus belangrijk dat de sample represtatief is voor de gehele populatie (sampling risk). De auditor kan
  hiervoor gebruik maken van ‘non-statistical sampling’ of ‘statistical sampling’ bij de test of details , test of controls of
  substantive testing.
   Test of Details (TOD): Meet of balansposten een x hoeveelheid materiële misstatements bevatten (in $ of €)
   Test of Controls (TOC): Meet de operational effectiveness van internal controls
   Substantive Testing of transactions: meet zowel de operational effectiveness van internal controls- als of
  monetaire eenheden juist zijn vastgelegd in het ‘accounting system’.
  Voor elk van deze testvormen is een andere sampling methode van toepassing. Bij TOD heeft men behoefte aan een
  sample uitgedrukt in dollars/euro’s (monetary unit sampling method), terwijl voor TOD en substantive de ‘rate of
  occurrence’ juist een rol speelt. Men maakt onderscheid in 3 methodes: (1) Non-statistical sampling, (2) Monetary
  unit sampling en (3) Variables sampling.
  16.2 – Non-statistic sampling
  De processtappen voor sampling zijn hetzelfde voor TOD als voor TOC en substantive namelijk:
   Plan the sample:
  (1) Bepaal doel van audit test, (2) Bepaal of audit sampling van toepassing is, (3)Bepaal misstatement , (4)Bepaal
  populatie,
  (5), Bepaal sampling unit, (6)Bepaal tolerable misstatement, (7)Bepaal acceptable risk of incorrect acceptance, (8)Schat
  misstatements in populatie, (9)Bepaal initiële samplegrootte.
   Select the sample:
  (10),Select the sample & (11) Perform audit procedures
   Evaluate the results:
  Gedownload door: pimdl | pimdl@hotmail.com
  Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
  € 912 per jaar
  extra verdienen?
  Stuvia – Koop en Verkoop de Beste Samenvattingen
  (12)Generalize form the sample to the population, (13)Analyze the misstatements, (14)Decide the acceptability of the
  population
  Maar er zijn wel een aantal subtiele verschillen:
  (1) In de planfase, bepalen we bij TOD, of accounts correct financieel zijn weergegeven (in dollar of euro uitgedrukt),
  (2) Bij vaststellen of we sampling moeten toepassen, kunnen we bijvoorbeeld kiezen bij een kleine populatie om bedragen < 5000 euro te negeren. We inspecteren dus alleen de bedragen > 5000 euro. Er is dus geen sampling,
  (3) Omdat audit sampling voor TOD is gericht op het meten van monetaire misstatements, een misstatement ontstaat wanneer een
  sample item is misstated. Indien er misstatement is, is het belangrijk om zaken zoals timing (i.e. transacties onderhevig aan rente
  of wisselkoersen) mee te nemen.
  Een methode van non-statistical sampling is stratified sampling, waarbij de populatie wordt verdeeld in 2- of meer subpopulaties.
  Iedere subpopulatie noemen we een stratum. Bijvoorbeeld:
  Stratum: Stratum Criteria: No. in populatie: Totale dollars in populatie:
  1 > 15.000 Dollar 3 88.955 Dollar
  2 5000 – 15.000 dollar 10 71.235 Dollar
  3 < 5000 dollar 27 47.105 Dollar + 207.295 Dollar Bij non-statistical sampling nemen we de populatie mee- evenals de confidence factor en de tolerable misstatement. Voor NonStatistical Sampling kunnen we de versimpelde formule gebruiken: Sample ¿ Population Recorded Amount ×Confidence Factor Tolerable misstatement Met daarbij: Risk of Incorrect Acceptance Confidence of Sample Confidence Factor: 37% 63% 1 14% 76% 2 5% 95% 3 (Zie ACIPA Sampling handbook) Voorbeeld: Stratum: Stratum Criteria: No. in populatie: Totale dollars in populatie: 1 > 15.000 Dollar 3 88.955 Dollar (Wordt apart getest)
  2 5000 – 15.000 dollar 10 71.235 Dollar
  3 < 5000 dollar 27 47.105 Dollar +
  207.295 Dollar
   De auditor beslist de 3 bedragen van stratum 1 niet mee te nemen, maar worden apart getest.
   Recorded amount = 207.295 – 88.955 = 118.340 Dollar
   Confidence factor = 2
   Tolerable misstatement: $ 15.000
  Sample ¿118.340∗2
  15.000
  =15.8=16 samples
  16.3 – Monetary Unit Sampling
  Monatery Unit Sampling (MUS) is de meest voorkomende statistiche methode voor TOD. MUS volgt ook de 14
  stappen zoals beschreven in 16.2 maar er zijn subtiele verschillen:
   Sampling unit is individuele dollars/euro’s/yen
   De populatiegrootte is dollar/euro/yen populatie
   Sample size wordt bepaald middels een formule
   Sample selectie wordt gedaan o.b.v. probability Proportional to Size Sample Selection (PPS).
  Voorbeeld van MUS:
   Acceptable Risk of Incorrect Acceptances (ARIA) = 10%
   Recorded Population Value (M) = 5.000.000 Dollar
   Tolerable misstatement (TM of TER) = 150.000 Dollar
  Gedownload door: pimdl | pimdl@hotmail.com
  Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
  € 912 per jaar
  extra verdienen?
  Stuvia – Koop en Verkoop de Beste Samenvattingen
   Tolerable misstatement as percentage of population = 150.000 / 5.000.000 = 0.03
   Estimated Population misstatement = 15.000 overstatement
   Ratio of estimated population misstatement to tolerable misstatement = 15.000 / 15.000 = 0.10
   Confidence Factor = 2.77 (o.b.v. 10% ARIA met tolerable misstatement ratio van 0.1)
   Sample Size n = ?
   Sampling interval = ?
  Waarbij:
  Ratio of expected to
  Tolerable Misstatement:
  Risk of Incorrect Acceptance (ARIA)
  5% 10% 15% 20% 25% 30% 35% 50%
  0.00 3.00 2.31 1.90 1.61 1.39 1.21 1.05 0.70
  0.05 3.31 2.52 2.06 1.74 1.49 1.29 1.12 0.73
  0.10 3.68 2.77 2.25 1.89 1.61 1.39 1.20 0.77
  0.15 4.11 3.07 2.47 2.06 1.74 1.49 1.28 0.82
  0.20 4.63 3.41 2.73 2.26 1.9 1.62 1.38 0.87
  n=
  ConfidenceFactor
  Tolerable Misstatement As percentage of populationValue
  Sample ¿ ¿
  2.77
  0.03
  =93
  Samplinginterval=
  5.000 .000
  93
  =53.763
  Powered by TCPDF (www.tcpdf.org)
  Gedownload door: pimdl | pimdl@hotmail.com
  Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
  € 912 per jaar
  extra verdienen?

Uitwerking oefententamen – Data
analytics & Process mining
geschreven door
Tilburgstudent
www.stuvia.com
Gedownload door: pimdl | pimdl@hotmail.com
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
€ 912 per jaar
extra verdienen?
Voorbeeldtentamen Process Mining
Datum : 04-06-2023
Datum tentamen : 09-06-2023

 1. De twee voornaamste vormen van proces mining zijn process discovery en conformance
  checking. Licht toe wat deze begrippen betekenen, en illustreer met een voorbeeld hoe ze
  zich tot elkaar verhouden.
   Process discovery : is het toepassen van process mining op bestaande event logs, om het ‘
  daadwerkelijke verloop’ van een proces weer te geven. Of het identificeren van nieuwe processen.
  Deze vorm wordt vaak toegepast wanneer het doel van de process-mining opdracht ‘efficiency’ is.
   Process conformance : is het toepassen van process mining op bestaande event logs, om vast te
  stellen of het ‘daadwerkelijke verloop’ van een proces overeenkomt met het eerder vastgestelde
  proces model. We vergelijken hier de werkelijke verloop met de verwachte/normatieve verloop van
  proces. Deze vorm wordt vaak toegepast wanneer het doel van de process-mining opdracht
  ‘compliance’ is.
  Voorbeelden hiervan zijn:
   Door het in kaart brengen van het claim-proces (Process Discovery) bij een verzekeraar. Kan worden
  vastgesteld of:
  o Claims allemaal dezelfde stappen doorlopen
  o Wat de gemiddelde doorlooptijd is van en claim en of er momenteel bottlenecks binnen het
  proces zitten.
   Binnen een audit kan worden gekozen om tijdens de planningsfase process mining toe te passen om
  risico’s op tijd te identificeren binnen bedrijfsprocessen (process conformance) door:
  o Bedrijfsprocessen in kaart te brengen zoals deze momenteel verlopen
  o Het in kaart gebrachte bedrijfsproces vergelijken met bestaande procesbeschrijvingen en/of
  process modellen
  o Afwijkingen identificeren tussen soll en ist en hier een risico-inschatting vna maken.
  Stuvia – Koop en Verkoop de Beste Samenvattingen
  Gedownload door: pimdl | pimdl@hotmail.com
  Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
  € 912 per jaar
  extra verdienen?
  Stuvia – Koop en Verkoop de Beste Samenvattingen
 2. Onderstaande tabel toont een extract van procesdata geregistreerd in een call center.
  Uw medewerker is gevraagd om hier een event log van te maken en stelt hierbij
  volgende structuur voor:
   Case id: hier kan het claim nummer voor genomen worden
   Activiteit: de status kan overgenomen worden
   Timestamp: het veld ‘time’ is een startpunt.
   Resource: hier kan het veld responsible voor genomen worden
   Location: als we de status als activiteit nemen, dan hebben we geen nood aan het apart opslaan van
  de locatie. Dat zien we dan wel aan de figuur.
  Gedownload door: pimdl | pimdl@hotmail.com
  Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
  € 912 per jaar
  extra verdienen?
  Stuvia – Koop en Verkoop de Beste Samenvattingen
  Volgens de medewerker zou de log er als volgt uit kunnen zien:
  Bespreek dit voorstel kritisch. Neem zowel de gemaakte keuzes onder de loep, als de vorm van
  de log. Zou dit ingevoerd kunnen worden in een process mining tool om een procesmodel uit
  te ontdekken?
  Om kwalitatief goede data te hebben, welke bruikbaar is voor een process mining tool, hebben we minimaal
  de volgende informatie nodig:
   Case
   Activity
   Timestamp
  De medewerker heeft gekozen voor Claim als de unieke Case_ID dit is passend omdat de Claim_ID uniek is
  voor elk ontvangen claim. Daarnaast heeft de medewerker gekozen om Status te gebruiken als de Activity. Dit
  is passend omdat in deze kolom de cornerstones worden beschrijven (i.e. claim komt binnen, beoordeling
  claim etc.). Als laatste heeft de medewerker time (de start-tijd) gekozen als timestamp. Dit is passend omdat
  we het begin- en einde van een processtap kunnen bepalen.
  Het enige waar we het niet mee eens zijn is activity, locatie en resource:
   De medewerker stelt dat informatie over de locatie weinig toevoegt omdat deze informatie zou staan
  in de kolom Status (Activity). Dit is niet waar, informatie over de locatie kan alleen worden herleid uit
  informatie over de resource (specifiek Call-Center Agent Brisbane & Sydney).
   Als we met process mining zouden willen vaststellen of het werkelijke afhandelingsproces afwijkt
  tussen kantoren Sydney & Brisbane, is het wenselijk om extra attribuut Location mee te nemen.
  Momenteel worden alle processen per kantoor samengevoegd. We kunnen in dit laatste geval dan de
  process-flow tussen de twee kantoren vergelijken en deze vergelijking meenemen in onze analyse.
   Omdat de resource niet uniek is (er zijn immers meerdere claims handlers en call center agents) is het
  wenselijk bij de Call Center Agent resource de locatie los te trekken van de functierol. Dit omdat:
  o We kunnen nu in de algemene zin iets zeggen over het verloop van processen voor zowel
  Sydney & Brisbane
  o Als we willen verbijzonder per kantoor, kan dit middels ‘location’
  Gedownload door: pimdl | pimdl@hotmail.com
  Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
  € 912 per jaar
  extra verdienen?
  Stuvia – Koop en Verkoop de Beste Samenvattingen
  Gedownload door: pimdl | pimdl@hotmail.com
  Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
  € 912 per jaar
  extra verdienen?
  Stuvia – Koop en Verkoop de Beste Samenvattingen
 3. Procesanalyse kan gebeuren vanuit één of meerdere perspectieven: een control-flow, tijds-,
  organisatorisch en caseperspectief. Leg elk van deze perspectieven uit in eigen woorden en geef een
  voorbeeldonderzoeksvraag van elk perspectief, gelinkt aan het voorbeeld uit vraag 2.
  Het klopt dat Business Process Management (BPM) o.b.v. process mining méér dan één perspectief kent.
   Control flow perspectief: Staat stil bij hoe processen daadwerkelijk lopen. Hierbij wordt een overzicht
  gemaakt van alle achtereenvolgende processtappen van begin- tot einde. Onderscheid hierbinnen
  wordt gemaakt tussen Process Discovery en Conformance checking.
  o Welke stappen worden doorlopen bij het aannemen van een claim? (process discovery)
  o Verloopt het daadwerkelijke afhandelen van claims, conform de procesbeschrijving voor
  claim-afhandeling? (Conformance checking)
   Tijdsperspectief: staat stil bij de rol van tijd binnen een proces. Dit kan terugslaan op performance
  mining (of hoe lang duurt elke processtap- en het aggregaat van processtappen?) en seasonal
  patterns.
  o Hoe lang duurt het aggregaat van processtappen voor het verwerken van een claim?
  o Welke seizoenspatronen zien we bij het afhandelen van claims?
   Organisatorisch perspectief: staan we stil bij de samenhang van individuen/groepen/afdelingen
  binnen de organisatie en/of andere entiteiten met wie men onderlinge relaties heeft. Denk hierbij aan
  een social network analysis en roles & Specializations
  o Welke rollen en/of specialisaties zijn betrokken bij het beoordelen van claims?
  o Hoe verhouden afdelingen zich t.o.v. elkaar binnen kantoren Sydney & Brisbane?
   Case perspectief: Hier pakken we als uitgangspunt één specifieke case waar we vaststellen hoe het
  proces verloopt
  o Hoe komt het dat claim nummer xxxx niet is uitgekeerd?
  Gedownload door: pimdl | pimdl@hotmail.com
  Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
  € 912 per jaar
  extra verdienen?
  Stuvia – Koop en Verkoop de Beste Samenvattingen
 4. “De footprintmatrix van een proces is een weergave dewelke voornamelijk van belang is voor
  conformance checking doeleinden.” Ben je akkoord met deze uitspraak? Bespreek waarom wel of niet.
  Ik ben het daar niet mee eens. Een footprintmatrix is één van de manieren om het verloop van een process te
  visualiseren (net als BPMN, Process Maps of Petri Nets). Deze weergavemethodes zijn niet uniek/exclusief voor
  conformance checking of process discovery. Deze weergave-methodes staan dus volledig los van Conformance
  checks of process discovery omdat een footprint-matrix ook gebruikt kan worden bij process discovery.
  Een kritische noot moet wel geplaatst worden: Als we ingaan op de verschillende manieren waarop we kunnen
  vaststellen of een proces conform een model is zijn hier een aantal methodes voor: Coarse approach, tokenbased, footprint-based, alignment-based en rule-based. Bij footprint-based methode wordt wel gebruik
  gemaakt van een footprint-matrix voor conformance checking. Maar dit zegt nogmaals niks of een footprintmatrix alleen gebruikt mag worden bij conformance checking.
  Powered by TCPDF (www.tcpdf.org)
  Gedownload door: pimdl | pimdl@hotmail.com
  Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
  € 912 per jaar
  extra verdienen?