faith

Kas teeme uueks aastaks plaane ka v?

Sissejuhatuse asemel alustan ilusate soovidega, sest unustasin eelmises postituses — head uut aastat kõigile! Meil tuli väga kenasti, käisime alustuseks hommikusöögil Narvas, siis tegime väikese Tartu spaakülastuse ja siis käisime Viitnas lõunal. Õhtuks juba olime kenasti teleka ees, vaatasime Dr Who’d ja tundsime rõõmu selle üle, et sai Harjumaalt ilusaid asju teistelegi viia. Okei, kõrtsis käisime päriselt ja tehniliselt jääb Kadrina vist juba mingi Virumaa alla ka, nii et ohtlikku elu elame (kuigi peale meie olid ainult ühes lauas veel inimesed). Muu oli omalooming, tahtsin mõnel siia kogemata sattunud lugejal vererõhku tõsta.

Aga uus aasta tuleb ju teadagi uusaastalubadustega. Minu uusaastalubaduseks on olnud mitu aastat, et puhkan rohkem ja ei tõmble end trennis sõna otseses mõttes vigaseks. Olen suutnud neid enamvähem ka pidada, paar korda on käest ära läinud, aga ühtki suuremat vigastust sel aastal ei olnudki, ei füüsilises ega vaimses plaanis, kuigi mõned sündmused võtsid natukeseks tempot maha küll. Aga. Aga-aga-aga. Me ei saa üle ega ümber sellest elevandist siin ruumis. Ja ma ei räägi oma kõikuvast kaalust, te teate, millest ma räägin.

Kui sa ei viitsi postitust lugeda, vaata pilti ja rohkem polegi vaja.

Jah. See lõputöö.

Näete, mis seisus ma olen, ma ei suuda kirjutadagi seda sõna. Olen selline närakas, et ainuüksi sellele mõtleminegi ajab südame pahaks. 🥺 Aga ilmselgelt tuleks ka see uusaastalubaduste hulka suruda. Sügisel kutsuti mind ühele üritusele ajaplaneerimisest rääkima ja ma ei saanud nagunii minna ka, aga endal ka kripeldas, et no kuidas ma läheks, kui ise lõputöödki tehtud ei saa. Nii et tuleb elada nii, et järgmisel sügisel oleks, millest rääkida. Aga. Olen siin korduvalt alustada üritanud, aga seis on selline, et leian kogu aeg muid kohustusi, millega oleks hädasti vaja kiiremas korras tegeleda.

Üks päev üritasin end sundida sellega, et enne trenni teha ei tohi, kui olen tund aega lõputööle mõelnud. Lõppes see püha üritus sellega, et trenn jäi tegemata. 😀 Täna on esimene päev, mil ma PÄRISELT natukenegi suutsin mõelda sellele asjale. Ja ma tean isegi täpselt, milles asi on. Kui ma tean, mida teha, võin ma töötada, palju vaja, andke ainult ette. Aga praegu on olukord selline, et eelmine plaan kukkus läbi, uut ei ole ja enne juhendaja ukse taha kraapima minekut, peaksin ma ise uue otsima, sest ma olen teda liiga palju üle lasknud juba, et uuesti sinna katteta lubadusi andma minna. Ainus asi, mis mul kind of on, on andmekogu — ja selle peaks ka tegelikult uue otsima. Okei, raam on tegelikult ka.

Raamistik on siis see, et tahaks uurida mingeid andmeid masinõppe meetoditega. Esialgne andmekogu oli tuhande aasta jagu majandusandmeid Inglismaa Pangast (natuke tuleb alla kerida, et seda näha). Vaatasin neid numbreid ja ainus idee, mis mul selle põhjal tuli, oli “ennustada” nende andmete põhjal seda, millised faktorid mõjutavad migratsiooni. Aga see plaan kukkus läbi, sest pärast hulka tööd kevadsemestril selgus, et selle jaoks pole piisavalt label‘eid (väga ülevaatlikult võiks öelda, et label on tulp, millest see masin õpib; selleks, et saada head ennustust, peaks neid ikka tiba rohkem olema). Nii et minu variandid oleks kas leida rohkem label‘eid, mis tähendab, et leida sarnaseid andmekogusid Skandinaaviast või romaanikeelsetest riikidest (sest neis saan ma keeltest piisavalt aru, et päriselt midagi asjalikku teha materjalidega) ja suurendada töö skoopi, või leida täiesti uus teema (ükskõik kas sama andmekogu põhjal või leida ise ka uus andmekogu). Ma parema meelega tahaks täiesti uut teemat, sest olgem ausad, see esialgne teema ei ole ju NII huvitav – st see on kind of huvitav, aga migratsiooni on ju saja erineva nurga alt uuritud, mis ma ikka sealt teada saan.

Nii et ma palun taas teie abi. Sada korda on teist kasu olnud, andke nõu mulle. Milline oleks huvitav teema, mida sarnasel kombel masinõppega uurida annaks? Kust saada häid ideid? Kas peaksin pöörduma narkootikumide poole, et inspiratsiooni ammutada? Kas ka illegaalseid narkootikume annab kuidagi kuluaruandesse panna? Nii palju küsimusi.

19 kommentaari “Kas teeme uueks aastaks plaane ka v?

  1. Aktuaalsetel teemadel – abortide määra uurida ja millega see korreleerub? kuigi sellega on see häda, et illegaalsed ei kajastu hästi statistikas, tähendab, eri riikide andmeid on raske võrrelda, kui seadused on erinevad.

    Narkootikumidest ja nende legaalsusest-illegaalsusest rääkides – kuidas see, mis ained on kuskil legaalsed, korreleerub kas mingite tervise- või siis hoopis kuritegevusnäitajatega.

    aa, kui migratsiooni enda andmeid vaadata ja neid on piisavalt pika aja pealt, siis kuidas see keelemuutustega kokku langeb.

    Ma tglt ei tea, kas sa pidasid midagi sellist silmas.

    Apropoo, Kadrina on Lääne-Virumaa, haigestumusnäitaja oli seal tänase seisuga Harjumaa omast üle 5 korra väiksem.

    1. No kas või abortidega saaks masinõpet seostada küll, kui tulpi on piisavalt palju – st et ma ei võrdle mitte niisama andmeanalüüsiga seda, kuidas on seotud seksuaalharidus ja abordid, vaid ennustan masinõppe abil, kuidas muutub abortide osakaal, kui jäätisepoodide arv väheneb/suureneb (või mis iganes muu tulp seal on, seksuaalharidus, usulahk, jäätisepoodide arv, legaalne seksuaalelu alustamise iga, rasestumisvastaste vahendite kättesaadavus jne).

  2. Minu viimane dilemma oli, kahjuks pole küll mahuka andmeanalüüsi küsimuse juures abiks, kas brasiilia depilatsioon läheks selle 100eurise töötaja motivatsioonitoetuse (mõnel pool ka sporditoetuse nimega) alla. Ilmselgelt mitte, kuigi võrreldes viimaste päevade jooksul, ja paistab, et asi jätkub, tööl* toimuvaga on brasiilia-sorti depilatsioon ääretult meeldiv ja lõõgastav kogemus. Justkui teraapiline lausa. Seega võiks tööandja ju toetada.

    *depilatsioon pole tööga seotud, see on puhtalt iseenda rõõmuks (Loodetavasti siinkohal enda, naisterahva rõõmu esiplaanile toomise järel keegi mind maalt välja saata ei taha, panen igaks juhuks vana ja nimetu meili siia.)

  3. kui tahta rämedalt päevakajaliseks minna, siis igasugu koroona-andmeid peaks siginema nagu seeni peale vihma. nt üks mu hispaania sõbranna teeb mingit uuringut kus nad uurivad koolilaste mikrofloora seost nende koroonasse haigestumisega. Seal on muidugi mingi 1000 last ainult kellelt analüüse võeti aga samas, nad ilmselt oleks rõõmsad kui keegi analüüsiks. teadlased üldse jagavad oma andmeid tegelt päris rõõmuga – ja osadel on finantseerimise lepingus isegi sees et andmed on vabad. st selleks et keegi teine saaks verifitseerida nende tulemust. Samas botaaniline andmestik sind vist väga ei huvitaks, aga no… mingist mega andmekogust teha metaanalüüs ja see oleks win-win kõigile.
    minu juhendaja mõtles nt et me peaks kokku ajama mingi mitmekümne artikli andmekogud ja nende põhjal uurima hüpoteesi et konkurentsi toleleerimistunnused on samad tunnused mis on koopereerumiseks vajalikud. ja see jäi selle taha et ma olen liiga loll ja ei oskaks nende andmetega midagi teha sest no neid tõesti oleks palju ja erinevaid. nii et arvesta sellega, et ma hakkan sult nüüd andmeanalüüsiküsimusi küsima 😀

      1. hullem veel – kuna ma hetkel ei tööta Eestis (ja see sõbranna ka mitte) siis see jookseks kokku mingi Hispaania reeglistikuga. samas kui andmed on ilusti anonümiseeritud siis ei tohiks hullu olla

  4. Ma pakuks sellise teema, (mis mind huvitab). Kas PISA testi tulemused on korrelatsioonis mingite muude andmetega ( nt isiksusomadused (Gladwell Outliers/Hofstede), elatustase jne). uue faktina lugesin kusagilt, et kliimasoojenemine toob kaasa CO2 sisalduse kasvu õhus, mis muudab meid kõiki lollimaks- ja sellest järeldades, kas nt õhu puhtus on tulemustega seotud. Ma tean, et on lineaarne sõltuvus inimeste pikkuse vs piimatarbimise vs korvpalli tulemuste vahel, aga kas loomse valgu tarbimine mõjutab ka PISA tulemusi.
    Ehk siis leida tarkuse valem

  5. Rentsi ees ootavate ülesannetega see ei sobitu, lihtsalt tuli tahtmine tänada idee eest, kuidas täita päevi, mil kodukontor võimaldab viilida ehk siis enamikku päevadest. Kommentaare lugedes tekkis mõte, et jube põnev oleks oma sugupuu põhjal teha statistikat inimeste keskmise eluea kohta mõne sajandi lõikes ja kuidas see seondub laste arvuga peredes. Alustades kaheksateistkümnenda sajandi keskpaigast kuni…ma’i teagi, ladvas on suurem osa ju elus veel… Sihuke nabasisese tolmurulli uuring või nii.

      1. see on see teema, mida on osaliselt nn youth bulge’i nime all uuritud (“noorusepais” on asi, mis juhtub, kui laste suremus on juba langnud (millega käib loogiliselt kaasas keskmise eluea tõus), aga sündimus veel langenud mitte). Aga see ei hõlma seda, kuidas ja kas on seotud lapseea üle elanud inimeste keskmine eluiga ja laste arv.

  6. Huvitav, kas mingi riigi 1000 aasta jooksul kogutud (rahandus)andmete põhjal saab järeldada ja ennustada suuremate massirahutuste ja/või sõjalaadse olukorra tekkimist. Praegune rahu Euroopas on ysna anomaalne ja täidetud erinevate kaane all mulksuvate probleemidega.

      1. Seda on võimalik andmete tõlgendamisega määrata, teades, et yhiskonnakorralduse, ringleva raha hulga, maksusysteemide muutused, yhiskonna suuremad kriisid jms on Sinu mõeldud raha mõistet, väärtust ja muid näitajaid muutnud. 1000 aastat on mistahes ajaloo osas ikka päris pikk periood ja siin tõesti ei ole jäikade raamatupidamislike meetoditega midagi teha.

  7. Sa oled filoloog? Keeletehnoloogidel on märgendatud ja märgendamata andmeid nii mis tapab, aga masinõppijatest alati puudus. Uuri mida iganes, sotsiaalmeediat, ajakirjandust, sõnavara, süntaksit, eesti keelt või prantsust, alpinismi sõnavara kasutust peavoolumeedias või trumpi pooldajate lauseehituse keerukust sotsiaalmeedias, tuhandeid teemasid.

    1. Jah, neid ideid ongi miljon ja ongi nii põnevad – kevadel me näiteks ennustasime koroonasurmade arvu erinevates riikides. Masinõpe ennustab juba patsiendi potentsiaalset surma paremini kui arstid jne. Raske lihtsalt seda kõige ägedamat, aga samas piisavalt lihtsasti uuritavat teemat välja valida. 😀

Lisa kommentaar

Täida nõutavad väljad või kliki ikoonile, et sisse logida:

WordPress.com Logo

Sa kommenteerid kasutades oma WordPress.com kontot. Logi välja /  Muuda )

Twitter picture

Sa kommenteerid kasutades oma Twitter kontot. Logi välja /  Muuda )

Facebook photo

Sa kommenteerid kasutades oma Facebook kontot. Logi välja /  Muuda )

Connecting to %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.