Komentorivi ja tekstinlouhinta

Antti Härkönen

2021-11-09

Tutkimusdatan organisointi

Datan muoto

Tekstidata

Datan tallennus

Tiedostojen nimeäminen

nimikonventio esimerkki
camel case suurtenMuinaistenAika
snake case suurten_muinaisten_aika
kebab case suurten-muinaisten-aika

Päivämäärät

Tekstinlouhinta

Kaukoluenta

Tekstinlouhinta

Korpus

Regex-haut

Big data

Siisti data

Terminaali

Vertauskuva

Wikimedia Commons

UNIX-filosofia

Komentoriviputki

TuukkaH, XcepticZP, jaettu Wikimedia Commonsissa

Powershell

navigointikomennot merkki
koti ~
nykyinen kansio .
ylempi kansio ..

Tärkeitä työkaluja

Kopioiminen

cp ./tiedosto/polku/teksti1.txt ./toinen/tiedosto/polku/teksti2.txt

Toisto

PS-komento Lyhenne UNIX-vastine
Get-Help help man
Set-Location sl cd / chdir (kansio)
Get-Location gl pwd
Get-Content gc cat
Get-ChildItem gci dir/ls
Rename-Item rni mv
Copy-Item copy, cpi cp
New-Item ni touch / mkdir (kansio)
Write-Output write echo
Select-String sls grep

Select-String

Tekoäly

Koneoppiminen

Ohjattu ja ohjaamaton oppiminen

Numiri, jaettu Wikimedia Commonsissa

Aihemallinnus

Latentti Dirichlet-allokaatio (LDA)

Laattakaavio LDA-mallista

Slxu.public, jaettu Wikimedia Commonsissa

MALLET

Lopuksi