Showing posts with label math. Show all posts
Showing posts with label math. Show all posts

2018-12-30

Kummallisia modulaatioita ja muita radioajatuksia, osa 4: impedanssihakkuri

Joskus kun lueskelin gyraattoreista, hakkureista, antenneista ja impedanssisovituksesta vähän ajan sisällä, tuli mieleen että ehkäpä noita käsitteitä voisi jotenkin liittää yhteen. Tämä on taas sellainen idea josta ei ole yhtään mitään hajua toimiiko se edes teoriassa, mutta pakkohan se on kirjata ylös silti ennen kuin unohtuu.

Antennien sovitus ja viritys

Antennin viritys tarkoittaa, että se saadaan resonoimaan tietyllä taajuudella, ainakin jossain määrin. Pohjimmiltaan yritämme saada käytetyllä taajuudella antennin kapasitanssin ja induktanssin sellaiseen tasapainoon, että resonanssiehto toteutuu: jännitteet ja virrat voivat erota kapasitanssin ja induktanssin muuttuessa, mutta aina löytyy kompensoiva arvo jompaa kumpaa joka saa antennin ominaisimpedanssin menemään puhtaan resistiiviseksi annetulla taajuudella. Parasta olisi jos antenni resonoisi ihan fyysisistä mitoistaan, koska virittäminen on tietyssä mielessä vähän kentän pakottamista ja johtaa suurempiin häviöihin kun energiaa pumpataan edestakaisin virityspiirin ja antennin välillä yli häviöllisen resistanssin. Mutta kyllä se silti resonoimaan saadaan, eikä parempaa oikein oo tehtävissä jos antenni on tietynlainen ja -kokoinen, käytännön syistä. "We'll use what we're given, and we'd better."

Impedanssisovitus on hieman eri asia joskin läheinen käsite. Antennitkin ovat suurikokoisina jonkin sortin maksimaalisen häviöllisiä, säteileviä aaltojohtimia osin. Mutta impedanssisovituksella on erillinen merkityksensä jopa täysin häviöttömille johtimille. Pohjimmiltaan aaltojohtimet kuten pari- ja koaksiaalikaapeli ovat infinitesimaalisesti katsoen resonaattoreita, joilla on tietty hajautettu kapasitanssi ja induktanssi. Ne on jo sovitettu yhteen niin, että äärettömän pienessä pätkässä kaapelia nuo ovat tasapainossa, ja siksi se tavallinen aaltoliikkeen etenemisehto että on kaksi toisiensa kanssa oskilloivaa suuretta (tässä sähkö- ja magneettikenttä) pääsee toteutumaan. Mutta kuten viritettyjen antennienkin laajemmassa resonanssissa, tässäkin hajautetussa raamissa resonoivan induktanssin ja kapasitanssin suhde voi olla lähes mikä vain. Sen takia siirtolinjalla on ns. karakteristinen impedanssinsa, eli se kuinka suuri osa energiasta varastoituu pisteittäin jännitteeksi/sähkökentäksi/potentiaaliksi/"voimaksi"/"paineeksi", ja kuinka suuri osa virraksi/magneettikentäksi/gradientiksi/"nopeudeksi"/"virtaukseksi". Esim. 50Ω:in koksissa jännitteen suhde virtaan on 2500, niin että energioiden/tehojen suhde on tietyssä täsmällisessä mielessä sen neliöjuuri, eli tuo 50, aivan kuten puhtaasti resistiivisessäkin tapauksessa. (Muista: teho skaalautuu jännitteen neliönä, koska se on jännite kertaa virta, ja tietty jännite ajaa tietystä vastuksesta lisäksi läpi tietyn virran; näissä vaihtovirta- ja radiohommissa lisäksi sitten vaihesiirto, joka johtaa loistehoon, ja jota tässä juuri yritetään sovituksella minimoida.)

Ideaalisessa siirtolinjassa signaali etenee tietyllä ominaisella nopeudellaan riippumatta siitä mikä linjan impedanssi on. Mutta jos impedanssi yhtäkkiä muuttuu, epäjatkuvuus tuottaa heijastuksen. Tästä me emme pidä, koska energia ei silloin mene kokonaisuudessaan läpi, heijastus voi tuottaa linjassa ikäviä resonansseja jotka kohottavat jännitteitä eli koettelevat komponenttien kestävyyttä sähkökentälle, ja tietysti virrat myös kasvavat samalla, jolloin häviö auttamatta mitättömänkin vastuksen kautta kertautuu paljon suuremmaksi resistiiviseksi hukaksi. (Ilmiö on täysin analoginen sille, kuinka tensiilivoimat (voima on jännitteen analogi, paine/tensiilimodulus kapasitanssin) ja massan hitaus (kineettinen energia on virran analogi, induktanssi massan/tiheyden) käyttäytyvät akustiikassa.) Niinpä olisi kiva että nuo epäjatkuvuudet saataisiin jotenkin sovitettua—mekaanisessa analogiassa "vivuttua"—pois. Se poistaisi heijastukset, ja mahdollistaisi parhaan mahdollisen energiansiirron.

Tavalliset keinot tehdä tuo ovat laajemmalla kaistalla muuntaja, ja kapeammalla kaistalla erilaiset resonantit rakenteet. Jälkimmäiset ovat erityisen olennaisia korkeataajuussovelluksissa, koska muuntajat ovat jatkuvasti häviöllisempiä mitä korkeammalle taajuudessa mennään. Niistä on myös vaikeaa rakentaa tehokkaita käyttämättä hyväksi ferromagneettisia materiaaleja, jotka sitten puolestaan tuottavat signaalia sotkevaa epälineaarisuutta. Suo siellä, vetelä täällä, kuten aina.

Helpoimpien, resonanssiin luottavien sovituspiirien ongelmana sitten yleisesti on, ettei tahdo oikein löytyä riittävän ideaalisia reaktiivisia komponentteja niiden toteuttamiseen. Isoin päänsärky yleensä on, että suuria, tarkkoja, riittävän häviöttömiä induktansseja ei tahdo löytyä, joskin vastaavasti myös kapasitorien/kondensaattoreiden jännitteensieto saattaa sotkea ajopuuteorian. Ylipäänsä, vaikka riittävästi komponentteja sisältävillä verkoistoilla olisi mahdollista teoriassa impedanssisovittaa piirejä laajemmankin kaistanleveyden yli, käytännössä analogisten komponenttien toleranssit ja häviöt, eritoten suhteessa yleisesti käytettyjen signaalien suhteelliseen kaistanleveyteen, johtavat siihen että sovitus tehdään alhaisasteisena ja siksi kapeakaistaisena. Analogikomponentit kun ovat ainoa vaihtoehto silloin kun verkoston täytyy myös kyetä hetkellisesti resonansseissaan varastoimaan merkittäviä määriä reaalimaailman sähkömagneettista energiaa; siinä digitaalitekniikka ja matematiikka eivät viime kädessä voi hirvittävästi auttaa.

Induktanssi, gyraattori, ja sitten sen ongelmat

Kuitenkin, induktanssia pystyy matkimaan käyttämällä hyväksi kapasitanssia ja tiettyjä piirimuunnoksia. Pari sellaista ovat kapeakaistaisena erilaiset siirtolinjoilla toteutettavat resonanssirakenteet kun ne päästetään juuri 90 astetta epäsynkkaan sovituksesta, ja laajempikaistaisina negatiivi-impedanssivahvistin (yksiporttinen) sekä gyraattori (kaksiporttinen). Ensimmäinen on aidosti energiaa varastoiva järjestelmä, mutta kapeakaistainen. Jälkimmäiset kaksi ovat piiriteknisiä jippoja, jotka emuloivat laajakaistaisestikin tarvittua, reaktiivista impedanssia, eli siis taajuussidonnaista "vastusta" kaikkine vaihesiirtoineen.

Mutta vain emuloivat: jos jotain pitää ottaa emulaation niin vaatiessa signaalista pois, ne hukkaavat sen lämmöksi. Ja jos jotain pitää vastaavasti laittaa peliin takaisin lisää, se otetaan vahvistimen syöttötehosta erikseen. Mitään varastointia ei tapahdu, eli nuo piirit eivät kykene esimerkiksi tuottamaan niitä voimakkaita virtapiikkejä joita oikeat kapasitanssit kytkettynä oikosulkuun, tai niitä miehekkäitä korkeajännitepiikkejä joita avoimeen piiriin kytketyt induktanssit. Raja on molemmin päin siinä kuinka paljon jännitettä ja virtaa virtalähteesi kulloinkin pystyy antamaan, eikä se ole järin paljon. Tuo on aivan eri tasolla kuin ne energiamäärät joita voidaan varastoida tasavirrassa kelaan ja tasajännitteessä kondensaattoriin. Sitten varsinkin jännitteissä aivan eri juttu kuin mihin resonantit korkeataajuuspiirit rutiininomaisesti yltävät—vrt. Tesla-käämi, kymmenissä miljoonissa volteissaan. (Ja tietty tässä aina ArcAttack!).

(Sivumainintana turvallisuudesta muuten, hyvin viritetyt sähköisesti lyhyet antennit, eritoten ohuina, on kaikkein vaarallisimpia: ne pakottaa radiokenttää korkeilla jännitteillä kun muutakaan eivät voi, ja sitten ohuutensa tähden niitten lähellä sähkökentät on jakautunu kaikkein pienimmälle alalle. Noi tuottaa välittömästi luuhun ulottuvia radiopalovammoja jos kosket itsesi osaksi sitä resonassipiiriä. Onneksi tosin kosketus pilaa piirin resonanssin, niin ettei sitä energiaa tule näpeille loputtomiin tai ihan kuitenkaan kerralla, ja mitä korkeampitaajuinen se kenttä on, sitä pinnemmaksi se energia ihmisen kaltaisessa suht'-johtavassa suolavesisäkissä jakautuu. Mutta samalla antenni kyllä dampattuna dumppaa koko seisovan energiansa suhun millisekunneissa, ja jos siellä takana on edes perusluokan amatöörin satawattinen vahvistin joka pumppaa jatkuvasti lisää tehoa sormille, vakavaa tuhoa on odotettavissa nopeasti. Eritoten jos kosket jänniteantinoodiin, niin että antenni kytkee enimmäkseen resistiivis–kapasitanssiseen ihmisruhoon niin tehokkaasti.)

Hakkurin ominaisuudet ja sigma–delta-muunnin

Ylläoleva normianalyysi luottaa lineaarisuus- ja passiivisuusoletukseen. Samalla me kuitenkin tiedetään jo, että epälineaarisuudella voidaan tehdä ainakin virtalähteissä kiintoisia juttuja. Selvästi myös pienentää tarvittavien induktorien kokoa, koska korkeilla taajuuksilla jo pienikin induktanssi riittää jännitteen kohotukseen: siinä virta lähtee kiertämään nopeammin, jännite voi olla varsin korkea kun piiri avataan silti, ja siksi tyyliin buck–boost-piirit voivat hakkurivirtalähteissä kohottaa jännitteen kymmeniä kertoja suuremmaksi, kunhan hakkurin taajuus on vain riittävän korkea. Häviöitäkin voidaan vähentää, koska kun vaadittu induktanssi on alhainen, voidaan parhaimmillaan mennä jopa ilmatäytettyihin keloihin.

Hakkurit pohjimmiltaan nopeissa kytkinsiirtymissään siirtävät energiaa taajuudelta toiselle. Jos ne olisivat ideaalisia, äärettömän nopeita kytkimiä, ne pystyisivät oikeastaan siirtämään minkä vain kapeakaistaisen signaalin äärettömälle kaistanleveydelle: modulaatio puhtailla delta"funktioilla" (impulsseilla, täsmällisemmin idealisaatio matemaattisen distribuutioteorian deltafunktionaaleista) tuottaa periodisena periodisen kaistarajaamattoman signaalin rajatusta, ja sitten epäperiodisilla jonoilla voidaan päästä keskimäärin täysin tasaiseenkin taajuusvasteeseen.Käytännössäkin kaikenlaisia epätäydellisistä realisaatioista johdettuja monivaiheisempia kompensaatioarkkitehtuureja löytyy heikan meikat.

Yleensä hakkuripiirit analysoidaan niin, että ne ovat täysin yksisuuntaisia. Lähdemme kerran tasavirraksi tasoitetusta energianlähteestä, joka sitten hakataan korkeampitaajuiseksi, tasasuunnataan uudelleen, ja alipäästösuodatetaan. Mutta noin ei missään nimessä tarvitsisi olla. Lisäksi epälineaaristen hakkuriarkkitehtuurien ei tarvitse olla edes sitä vähää kaksisuuntaisia kuin passiivipiirien; ne voivat ihan vain kytkemällä halutusti piirejä puolelta ja toiselta pienenkin reaktiivisuuden läsnäollen välissä, jäljitellä laajoilla aika- ja taajuusalueilla tarkasti suunniteltuja epäsymmetrisiä impedansseja. Siirtää energiaa taajuusalueelta toiselle myös, laajakaistaisesti, ja teoreettisesti epäsymmetrisestikin, jos niin halutaan.

Tarkimmat—joskaan eivät nopeimmat—nykyiset analogi–digitaali–analogi-muuntimet perustuvat sigma–arkkitehtuuriin, jossa ylinäytteistetään, tehdään suurin osa anti–aliasing- ja -imaging-suodatuksesta digitaalisesti, ja sitten annetaan leppeän alhaisen asteen analogisuodattimen tehdä loput. Tuo on peruskuva varsinkin audiosignaalinkäsittelypuolelta johon tuota baseband-juttuna ekana sovellettiin, mutta sitten se vähemmän tunnettu puoli on, että oikeastaan sigma–delta-modulaatio soveltuu yleisesti kvantisointikohinan siirtämiseen kaistalta toiselle. Ainakin tietyissä rajoissa, ja oikein toteutettuna. Se voi siirtää kohinaa hyötykaistan sisälläkin, se on yhdistettävissä psykoakustiseen epälineaariseen prosessointiin kuten Sonyn Super Bitmappingissa, ja radiohommissa se aivan yhtä hyvin toimii niin että siirretään kvantisointikohina hyötykaistan alle, siinä missä yleensä audiossa ylle—merkittävä säästö komponenttien nopeudessa, ja analogisten suodattimien asteessa/hinnassa/tarkkuudessa. (Vrt. bandpass sampling; rajoittava tekijä on kytkimen nopeus, eli sen slew rate, jitter, kanavakapasitanssi, piirin läpimeno glitcheissä, ja kaikki se. Ihanteellisessa altanäytteistämisessä ΣΔ-arkkitehtuurit vähentävät jyrkästi ylintä vaadittua kytkemistaajuutta, ja yhdistettynä muihin aiempiin hakkuriperiaatteisiin, voivat johtaa jopa lähelle minimaalista. Jokainen kytkentätapahtumahan tuhlaa energiaa, koska vain jännitteen ja/tai virran yli kytkimen on niin että hukattu teho voi olla nolla; resonanteissa systeemeissä tätä käytetään hyväksi luokan F ja E radiovahvistimissa, joissa kytkentä tapahtuu suunnitellusti virran tai jännitteen nollakohdissa, aina.)

Kaksisuuntaisuus ja resonantti energian varastointi

Ongelma kuitenkin on tuo energian varastointi. Sehän me jo tiedettiin, että analogiset passiivikomponentit voivat varastoida energiaa, siinä missä operaattorivahvistimin toteutettu gyraattori ei. Kun se on resistiivisesti toteutettu harha, joka syö virhettä ja korjaa vajeen uudella energialla syöttöjännitteestä.

Mutta mitäs jos me nyt sitten suunniteltaisiinkin se hakkuripiiri kaksisuuntaiseksi? Mitäs jos se voisi syödä suunnitellusti takaisinheijastunutta energiaa ja varata omaa resonanttia tankkipiiriään sillä? Sitten suunnitellusti kytkeä sen takaisin antenniin, kun aika on?

Käytännön toteutus voisi olla aika tuskainen, mutta teoriassa tuolle ei ole nähdäkseni mitään estettä. Se vaatisi jonkinlaisen kaksisuuntaisen, täyden ja täysin ohjatun siltakytkennän kahden eri resonantin piirin välille. Kun yksi haluaa luovuttaa energiaa toiselle, kytkimet antaisivat tehdä niin suuntaan kuten toiseenkin. Kun olisi aika ajaa piiriä, suuntaan tai toiseen, silta myötäisi ja tuottaisi yhdenpuolisesta tankkipiiristään tarvitun ajavan jännitteen, eli siis työntäisi energiaa resonantista systeemistä toiseen. Mahdollisesti hyvinkin korkeilla jännitteillä. Kun taas pitäisi hillitä toista piiriä, se voitaisiin kytkeä oikosulkuun toisen vastakkaista jännitettä vasten; kuten tunnettua, resonantit piirit voivat pienilläkin energioilla saavuttaa korkeita jännitteitä sekä virtoja, eritoten korkeilla taajuuksilla, joten isoakin piiriä voi kytkien "potkia" kunhan energiabudjetti vain on kohdallaan.

Vai olisiko kumpikaan piiri edes resonantti sitten? No ei täsmällisesti. Mutta eipä ole kyllä antennipiirikään; jos se olisi ihan vain täydellisessä, kapeakaistaisessa resonanssissa, se olisi piiriteknisesti avoin piiri resonanssitaajuudellaan. Siihen ei voisi syöttää energiaa. Me itse asiassa luotamme radiatiivisiin ja muihin häviöihin joka tapauksessa, jotka vievät piirin pois resonanssista, jotta ylipäänsä voimme syöttää siihen energiaa. Tai eristää päin vastoin energiaa jotenkin piiristä. Ideaalitapa sitten on käyttää mahdollisimman epälineaarista kytkentäelementtiä, kuten tässä, niin ettei jännitettä ja virtaa ole kytkentäelementin yli samaan aikaan, niin että tehohäviö minimoituu.

Jos noin voi tehdä yhden piirin kanssa kerrallaan, sen voi takuuvarmasti jollain siltakytkennällä tehdä myös yhteisesti kahden eri piirin välillä samaan aikaan. Mikä on mun ajatukseni sitten pohjimmiltaan tässä. Tuosta ajatuksesta taatusti päädytään siihen että ainakin matalajännitepuolella joudutaan lisäksi kertomaan virtoja ja/tai jännitteitä jotenkin, korkeahkoilla kytkentätaajuuksilla. Mutta kun jompi kumpi on kerran käytettävissä, energiaa varastoivana tekijänä, kytkin voi aina johtaa toisen, ja se voi tehdä niin ajastetusti juuri oikeaan aikaan.

Hieman signaalinkäsittelyä väliin vielä

Eli kuten sanottu, kytkin voi johtaa induktorin virrasta jännitettä, ja tarpeeksi korkeaan jännitteeseen ladatusta jännitteestä kapasitorin/kondensaattorin yli vaikka sen jännitepiikin joka katkaistu käämi tuottaa. Olennaista on vain se että tarvittava energia on varastoitu valmiiksi, ja se että kytkimet ovat riittävän nopeita tekemään työnsä. Että radiosuunnittelu on oikeaa, kaksisuuntaista, ja sigma–delta-henkistä: kun kytket, suodata oikein, vältä turhaa kytkemistä, ja pysäytä kytkentämelu/-kohina mahdollisimman häviöttömiin passiivisuodattimiin, mieluiten kohinansiirron (noise shaping) sekä alinäytteistyksen kautta (koska ylinäytteistys koettelee kytkinelementin taajuusrajoja itsessään).

Tämä olisi mahdotonta tehdä puhtaasti analogipuolella, edes takaisinsyöttökorjattuna. Digitaalipuolella varsinkaan, koska digitointiviive. Mutta pseudotakaisinsyöttö on digipuolella täysin mahdollista ja tehokasta. Me voidaan helposti mitata miten analogipiirit käyttäytyvät, ja rakentaa varsin kelvollinen yhdistelmä matala-asteista Volterra-kerneliä yhdistettynä korkea-asteiseen LTI-malliin, forward correctioniksi noille piireille. Meillä on tajuttomasti suorastaan pseudolineaarisia prioreita ja niiden matala-asteista epälineaarista korjausteoriaa vaikkapa audiosignaalinkäsittelypuolelta, joiden varassa optimoida koko homma läpi. Joten me voidaan helposti rakentaa hyvä ensimmäinen arvio siitä miten tommoset oudot, kaksisuuntaiset hakkuripiirit käyttäytyy, me tiedetään jo mitä niistä pitäisi mitata jotta niiden epätäydellisyydet saataisiin hallittua teoreettisesti, ja meillä on ihan riittävästi signaalinkäsittelytehoa sekä -teoriaa käytössä, että me voitais oikeesti toteuttaa jopa toi idea. Ei ehkä täydellisenä korjauksena, mutta ekaltakin hyvänä ja sitten itseoppivana, toteutuskelpoisena.

Ongelmat, ja mutta…

Ei niin hyvää ettei jotain pahaakin. Enkä ole taaskaan laskenut mitään vaan menen intuitiolla. Mutta… Tärkeimmät ongelmat taitaisivat olla:

  • Kytkinten nopeus, eritoten sigma–delta-tyyppisissä jatkuvasti vemputtavissa modulaatioissa; toi tuhlaa energiaa ja lämmittää turhaan, vaikka onkin teoreettisesti helposti analysoitavaa
  • Monimutkaisten, kaksisuuntaisten siltakytkentöjen tarkka ajastus; nää menee glitchistä läpilyöntiin helpommin kuin juuri mikään muu, varsinkin radiotaajuuksilla, ja sitten koneesta pihahtaa vaan sininen savu
  • Kellutus ja siitä seuraavat epätehokkuudet; oon aika varma että nää kytkennät vaatis kytkinelementtien kellutusta kahteen suuntaan, korkeilla jännitteillä ja/tai virroilla, mikä on tosi vaikeaa tehdä ilman häviöllisiä lisäkomponentteja ja monimutkaisia piirejä; tyyliin, aika vaikee uskoa että kukaan ilman tällaista sovellusta ois tuottanu mitään laser-laukaistavia voima-HEMT:ejä tjsp.
  • Monta lisääkin oli mielessä ennen kuin join taas; jatketaas tästä myöhemmin siis taas… 🙃

2018-09-22

Ryhmä- ja vaiheviive

Kun analysoimme sitä miten signaalit kulkevat erilaisissa väliaineissa, kuten tyhjiössä, ilmassa, sähköjohdossa tai valokuidussa, kuvaamiseen yleisesti käytetään lukuisia eri suureita, hieman riippuen siitä mihin analyysissa tähdätään. Yleisimmät suureet ovat varsinainen siirtonopeus (erit. valonnopeus tyhjiössä fundamentaalisena fysikaalisena suureena), vaihenopeus, ja ryhmänopeus. Näiden keskinäiset suhteet kuitenkin usein aiheuttavat hämmennystä.

Kun en ole nähnyt vielä yhtäkään siedettävää kuvausta näiden suhteista, mukaanlukien Wikipedia, katotaas saanko tehtyä tän ite paremmin.

Aaltoliike

Kun analysoimme aaltoliikettä, usein on tapana yksinkertaistaa se matemaattisesti ihan vain osittaisdifferentiaaliyhtälöiksi tasaisessa väliaineessa. Tuossa analyysissa päädytään lähelle ns. aaltoyhtälöä eri keinoin, eri väliaineissa. Mutta yhteistä näille kaikille on silti kaksi yhteistä tekijää: jokin voima joka välittää liikettä eteenpäin väliaineessa, ja jokin joka paikallisesti varastoi energiaa väliaineessa, pisteittäin. Säteilevä aaltoliike on kaikissa väliaineissa sitä, että tuo työntävä tekijä siirtää energiaa pisteestä toiseen, kiihdyttää energian varastointia siihen säilyttävään, ja se säilyttävä tekijä takaisinsyöttää siirtävää tekijää niin että energia voi siirtyä eteenpäin.

Ääniaalloissa potentiaalienergiaa säilyttävä tekijä on paikallinen ilmanpaine, ja siirtävä tekijä ilman molekyylien keskimääräinen liike tiettyyn suuntaan. Tässä paine-erot syöttävät nopeutta, jolloin paineeseen varastoitunut energia muuntuu molekyylien liike-energiaksi, korkean paineen alueelta kohti matalamman paineen aluetta. Päin vastoin syntynyt liike vie molekyylejä uudelle alueelle, joiden paine kasvaa. Prosessi toistuu jatkuvasti uusien molekyylien kanssa, jotka eivät keskimäärin hirveämmin liiku, mutta energia etenee silti väliaineessa.

Sähkömagneettisissa aalloissa kuten radioaalloissa ja valossa vuorottelevat sähkö- ja magneettikenttä. Sähkökentän muutokset ajavat magnetismia, ja magnetismi ajaa sähkökenttää. Tuollainen säteily on monimutkaisempaa kuin ääni, koska säteilyllä voi olla transversaalisena jutskana myös polariteetti, mutta periaate on muuten täysin sama.

Johtimissa lisäongelmaksi tulevat kaiken sortin virrat ja niiden vastukset. Pitää mitata vuotoa johtimesta toiseen ja vastusta johdinta pitkin. Aaltoyhtälö ei enää ole ns. häviötön, mutta tuo kenttien vuorottelu menee täysin saman periaatteen mukaan kuin vapaassa avaruudessa.

Veden pinta-aalloissa vuorottelevia tekijöitä ovat korkeus pinnan keskikorkeudesta joka ajaa paikallista hydrostaattista painetta (potentiaalienergia), ja sivuttainen paine joka ajaa aaltoliikettä sivuttain. Lisäksi tulee kaikenlaisia jänniä veden pystykiertoon, turbulenssiin ja pintajännitykseen liittyviä ilmiöitä, jotka tekevät tämän sortin aaltoliikkeestä ns. epälineaarista ja siten hankalammin analysoitavaa. Mutta ihan vain energiansiirron mielessä peruskuva on jälleen sama, varsinkin erittäin pienissä aalloissa.

Kiinteiden aineiden ja erit. kiteiden sisäisissä värähtelyissä homma on vieläkin monimutkaisempaa, koska kidehila joustaa eri tavoin eri suuntiin, ja voi tukea niin pitkittäis-, poikittais- kuin kiertoaaltojakin, kaikkien ollen ainakin suuremmissa voimakkuuksissa epälineaarisia. Mutta periaate ei vieläkään eroa pohjimmiltaan mitenkään: jokin sivuttaisvoima ajaa jotakin paikallista, ja se edelleen uudelleen sivuttaista takaisinpäin, niin että energia voi siirtyä paikasta toiseen ilman että väliaine olennaisesti liikkuu paikaltaan.

Niinpä voimme yleistää asian ainakin helpoimmalla tasolla niin, että aaltoliikettä tukeva väliaine voidaan karakterisoida kahdella suureella: sillä kuinka "jäykkää" se on ja sillä kuinka "painavaa". Ensimmäinen kertoo kuinka vahvasti voimat välittyvät väliaineen sisällä; mitä jäykempi aine, sitä nopeammin aaltoliike kulkee siinä. Toinen kertoo kuinka vaikeaa väliainetta on liikuttaa; mitä paksumpaa se on, sitä hitaammin voimat liikuttavat sitä, ja sitä hitaampaa säteily siinä siis.

Sähkömagneettisessa säteilyssä tyhjiössä tarvittavat suureet ovat tyhjiön permittiivisyys ja sen permeabiliteetti. Äänelle kaasussa/ilmassa tarvittavat suureet ovat (suunnilleen) paine ja tiheys. Kiteissä tensiilivoimat ja tiheys näyttelevät analogista roolia. Siirtolinjoissa sähköiselle signaalille käytetään makrotasolla ns. sähköttäjän yhtälöjä, jotka lähtevät kapasitanssista ja induktanssista vaihtelevina suureina per yksikköjohdonmitta, ja lisäävät häviötermeinä resistanssin sekä transkonduktanssin. Ja niin edelleen; kaikki samaa kamaa lopulta, taas.

Resonoivan väliaineen ongelma

Nyt on kuitenkin niin, että vain sähkömagnetismi tyhjiössä käyttäytyy tässä kiltisti. Se on ainoa tunnettu säteilyteoria, jolla ei varsinaisesti ole väliainetta, joka voisi vaikuttaa itsekseen säteilyn etenemiseen. Kaikki muut yleisesti tunnetut säteilyn muodot etenevät jossain väliaineessa, jolla on itsenäistä käyttäytymistä.

Tärkein tällaisen käyttäytymisen muoto on se, että väliaine kykenee paikalliseen värähtelyyn ilman ulkoisia heijastavia pintoja jotka tuottaisivat erikseen värähtelijän. Molekyylit joista ilma koostuu kykenevät värähtelemään aivan itsekseenkin, aivan kuten kykenevät ne molekyylit joista valoa johdattava kuitu tai linssi koostuu. Niinpä jos haluamme katsoa värähtelyä todellisissa väliaineissa, pitää ymmärtää myös se miten värähtely siirtyy sivuttain itsessään jo omalla tavallaan värähtelevien yksiköiden välillä.

Tällainen analyysi on asteen verran vaikeampaa, koska se on tilastollisen mekaniikan piirissä. Kun tönäiset toisesta päästä tyhjiötä sähkömagneettisella aallolla, aalto menee mielivaltaisia matkoja sen läpi pohjimmiltaan muuttumatta, koska matkalla ei ole mitään mikä värähtelisi itsenäisesti. Tyhjiö on tyhjiö, ja se siitä. Mutta kun vaikkapa sähkömagneettinen säteily—valo!—kohtaa kvartsikiteen, siellä kyllä on vastassa aivan omat ominaisvärähtelytaajuutensa jotka seuraavat kvartsin molekyylipainosta ja molekyylien välisistä palauttavista Coulomb-voimista. Yhtäkkiä väliaineella on väliä, eikä kaikkiin värähtelyn aallonpituuksiin/taajuuksiin tule samanlaista vastetta. Yleisesti ottaen vaste hidastuu, ja siitä tulee keskimääräinen, tilastollisen fysiikan piirissä oleva ilmiö. Tuloksena, tyypillisesti väliaineessa kulkeva aaltoliike hidastuu, ja riippuen siitä miten väliaine luonnostaan mikroskooppisella tasolla tykkää resonoida, makroskooppisella tasolla se sitten johtaa eritaajuuksisia aaltoliikkeitä eri nopeudella.

Tämä efekti tietysti tunnettiin kauan ennen kuin ymmärsimme aineen mikroskooppista rakennetta kunnolla. Tästähän esim. on silmälasit tehty: me tiedämme että tietyt yhdisteet johtavat tiettyjä näkyviä valon aallonpituuksia hitaammin kuin ilma, jolloin ilma–lasi-rajapinnassa valo taittuu, niin että voimme tehdä lasista fokusoivia linssejä. Tämä toimii kapealla aallonpituusalueella aika hyvin, mutta sekin on jo tiedetty pitkään vaikkapa valokuvauksessa että väliaineet taittavat sisäisten ominaisuuksiensa tähden eri aallonpituuksia eri tavalla. Niin että kaikenlainen kromaattinen korjaus on tarpeellista jos halutaan todella tarkkoja valokuvauslinssejä vaikka. Tuo tulee suoraan siitä että se nopeus jolla eritaajuinen säteily menee väliaineen läpi on ensimmäisessä analyysissa, kapealla taajuusvälillä, niinni materiaalin ominaisuuksista. Niin että taipumiskulmat muuttuvat kapealla välillä sen mukaan mikä värähtelyn aallonpituus rajapinnassa on.

Homma menee sitten huomattavasti monimutkaisemmaksi vielä, kun puhutaan laajemmasta taajuuskaistasta, ja väliaineista jotka itsessään värähtelevät paikallisesti enemmän. Tavallisestihan on niin, että väliaine hidastaa tiettyä aallonpituutta sitä enemmän mitä lyhyempi se on, eli mitä korkeataajuisempi. Sininen valo kulkee lasissa hitaammin kuin punainen, eli eroaa aina tiettyyn suuntaan prismassa. Kun kuuntelet tulevaa junaa joka kolahtaa radanpätkän väliin, pitkittäin yhteenhitsatussa metallisessa raiteessa etenevä impulssi tuo sun luo ensin matalat ja sitten korkeat äänet, eli se kuultava ääni—joka tulee kauan ennen junaa koska metalli johtaa ääntä paljon nopeammin ja paremmin kuin ilma—"chirppaa" alhaalta ylös.

Näin ei kuitenkaan aina tarvitse olla, vaikka se on tavallisin ja tunnistettavin tulos. Tämä sitten vihdoin johtaa itse kirjoitukseni aiheeseen, eli siihen miten nuo eri tavat mitata aaltoliikkeen/äänen/valon nopeutta väliaineen läpi voivat käyttäytyä epäintuitiivisesti.

Yleisesti käytetyt viivemittarisuureet

Tavallisesti kun puhutaan viiveestä väliaineen läpi, mainitaan ainakin vaiheviive, ryhmäviive, ja propagaatioviive. Näistä propagaatioviive on yksinkertaisin ja helpoimmin ymmärrettävä: se tarkoittaa yksinkertaisesti sitä kuinka nopeasti puhdas, laajakaistainen askelfunktio menee läpi tietystä mediasta. Sekin tietysti voi olla aika vaikeaa kvantifioida mikä on tai ei ole ollut mennyt läpi tietyn kanavan, mutta paras ilmaisu voidaan kyllä informaatioteoreettisesti määritellä, ja se on tismalleen sama juttu kuin kuinka nopeasti tietyssä väliaineessa ylipäänsä kulkee signaaleja, keskiarvoistettaen ja otettaen huomioon kaikki taajuudet sekä virhelähteet samaan aikaan. Tyhjiössä ilman mitään ulkopuolisia häiriöitä tuo analyysi kohtaa suoraan valonnopeuden.

Vaihenopeus

Vaihenopeus on johdettu suure, joka tarkoittaa sitä kuinka nopeasti tietty sinimuotoinen signaali näyttää kulkevan väliaineen läpi. Se määräytyy siitä, kuinka pitkä aallonpituus on väliaineessa, suhteessa varsinaiseen kulkunopeuteen. Valolle tyhjiössä se on aallonpituudesta riippumatta täysin sama valonnopeus. Kun valo kulkee lasissa, lasin laadusta ja valon aallonpituudesta riippuen valo hidastuu eri määriä. Tuota hidastumista kuvataan taittokertoimella, joka on nopeuden suhde tyhjiöön tietyssä lasissa. Perinteisessä optiikassa sitä on kuvattu yhdellä ainoalla taittokertoimella, mutta todellisuudessa tuo riippuu taajuusalueesta, eli valon tai muun sähkömagneettisen säteilyn täsmällisestä aallonpituudesta myös.

Ryhmänopeus

Ryhmänopeus on kapeakaista-analyysista johdettu suure. Se lähti alunperin lähinnä radiotekniikasta, jossa oli tarve moduloida kapeakaistaisia, korkeataajuisia signaaleja paljon hitaammilla aaltomuodoilla. Tyyliin AM-radio, jossa satojen tai tuhansien kilohertsien kantoaaltojen voimakkuutta vaihdeltiin puhetaajuisilla signaaleilla. Näissä järjestelmissä olennaista ei ollut se mitä kantoaallossa täsmälleen tapahtuu, vaan vain se kuinka kantoaalto keskimäärin vaihteli useiden tuhansien tai pahimmillaan miljoonien sykliensä yli. Niinpä puhuttiin lähinnä ns. "verhokäyrästä", eli kantoaallon keskimääräisestä voimakkuudesta, itse kantoaallon asemesta.

Kun käytetään tällaisia modulaatiotapoja, eikä moduloiva "hyötysignaali" ole liian voimakas tai laajakaistainen, on paljon helpompaa analysoida asioita kantoaallon välittömässä ympäristössä, sen sijaan että puhuttaisiin radiosignaalista kokonaisuutena. Voidaan tehdä tietty helppo pikku matemaattinen muunnos, joka pätee juuri siinä kantoaallon lähellä. Se kertoo, että moduloivan signaalin ajallinen hajauma on tietyssä suhteessa kantoaallon nopeushajontaan pohjatasolla. Mitä enemmän hajontaa, sitä enemmän moduloiva signaali hajoaa.

Samalla tuo muunnos kuitenkin paradoksaalisesti kertoo myös, ettei se moduloiva hyötysignaali aina näytäkään etenevän aivan samalla nopeudella kuin kantoaalto. Tämä on johtanut sitten aika mielettömään määrään väärinymmärryksiä radio- ja muussakin tekniikassa.

Selitys oudoille suhteille eri nopeuksissa

Perusongelma näissä hommissa on se, että selitysmalli on lähtenyt aikaisesta radiotekniikasta, jossa käsiteltiin pakosta vain moduloituja kantoaaltoja. Ei sähkömagneettista säteilykenttää kokonaisuutena, kun siihen aikaan sitä ei voitu. Silloin tehtiin puhtaasti kapeakaista-analyysia kantoaallon ympärillä, ja yksinkertaistettiin siis analyysia jyrkästi.

Kokonaisemmin katsoen on aivan ilmiselvää, että kaiken väliaineen, eli siis muun paitsi täysin puhtaan tyhjiön, vaiheviiveet vaihtelevat väliaineesta riippuen. Ne vaihtelevat myös aika monimutkaisesti, koska väliaine on monine eri molekyyleineen aika monimutkaista. Aivan jo vain tuon yksinkertaisimman ylläesittämäni mallin mukaan, jossa on painavia juttuja ja välivoimia, ilmassakin on äänitaajuuksille jo ainaskin kolme merkittävää erilaista molekyyliä tiellä, erillisine painoineen ja välitysvoimineen. Optisilla taajuuksilla nuo samat pirulaiset taipuvat, pyörivät, virittyvät, resonoivat ja vaikka mitä vielä paljon useammilla tavoilla. Eli onko se ihmekään, että valo/SM-säteily ei mene tuolla tavalla itsekseen resonantista väliaineesta aina läpi aivan samoilla nopeuksilla, eri taajuuksilla.

Ne oudot suhteet sitten yleensä tulevat siitä, että ollaan lähellä jotain väliaineen läheistä resonanttia taajuutta. Ne ovat näkökulmasta riippuen määrittelyharhoja, tai kiintoisia, hyödyllisiä resonanssi-ilmiöitä. Tyyliin, jos media on sellainen, että käytetyllä kaistalla korkeammat taajuudet menevät paikallisesti nopeammin läpi, moduloitu pulssi venyy "eteenpäin". Jos hitaammin, venyy taaksepäin.

Sitten jos se venyminen/dispersio alkaa mennä kumpaankaan suuntaan yli kantoaallon aallonpituuden, mennään näennäisiin hulluuksiin. Yhtäkkiä peräkkäiset kantoaallon aallot ja modulaation tuottamat jatkuvat sivutaajuudet voivat interferoida keskenään niin, että niiden kantama modulaatio/verhokäyrä voi näyttää liikkuvan mielivaltaisella nopeudella suhteessa kantoaaltoon. Se voi olla paradoksaalisen hitaastiliikkuva, se voi pysyä paikallaan, se voi liikkua jopa näennäisesti taaksepäin siirtolinjalla, ja niin, voi se näyttää liikkuvan jopa nopeammin kuin signaali itsekin. Hieman kuin varjo toki voi liikkua yli valonnopeudella, vaikka sen aiheuttava valo onkin puhtaasti tavallisen valonnopeuden ja kausaalisen välityksen piirissä. Mutta noin voi tapahtua vain kapeakaista-analyysissa; jos katsot koko kaistaa kokonaisuutena, synkronisesti, mikään signaali ei koskaan mene läpi alle paikallisen "valonnopeuden". Kaikki verhokäyrän omituisuudet ja näennäiset häröt vaihenopeudessakin aina liittyvät differentiaalisiin etenemisnopeuksiin kapeilla kaistoilla, ja niitä tuottaviin paikallisiin resonanssi-ilmiöihin. Kun tuon tajuaa, yhtäkkiä koko homma pelkistyy tosi simppeleihin, suorastaan lineaarisiin osittaisdifferentiaaliyhtälöihin, eikä edes kovin vaikeisiin sellaisiin.

Loppusana

Nämä eri viivemittareiden väliset diskrepanssit ovat siis kapeakaista-arvion tuottama häive, aivan kuten varjo ei ole signaali joka voisi välittää tietoa. Ilmiöitä nuo ovat, jotka voidaan mitata, ja on hyviä syitä mitatakin noita ilmiöitä silloin tällöin. Mutta nuo ilmiöt eivät ole sillä tavaalla kausaalisesti kytköksissä, että ne voisivat välittää informaatiota. Ne ovat ns. "epifenomenaa" varsinaisen "fenomenan" asemasta; näennäisilmöitä, jotka johtavat ihmistä intuitiivisesti harhaan pohjallavaikuttavan fysikaalisen ilmiön luonteesta. Niinpä ei pitäisi olla suurikaan ihme, että niistä puhutaan niin paljon ja niitä ymmärretään niin heikosti. Totta kai ne näyttävät oudoilta jollei tajua mistä ne tulivat; mutta sitten kun niiden yhteyden tajuaa, yhtäkkiä ne ovat täydellisen yksinkertaisia.

Toivottavasti autoin ymmärtämään edes puolet niiden syntymekanismista tässä. Koska se toinen puoli jäi taatusti näin kännissä selittämättä vielä, kertokaas sitten (harvat) lukijani missä pahimmat aukot olivat. Koska ois halu täyttää nekin.

2009-12-15

Accounting wonders

Once upon a time I have (unsuccessfully) worked as the fund-keeper of a small private organization. It was my first time, and I had very little practical understanding of accounting. Sure, I knew precisely how it was done in theory, and that wasn't the problem; my eventual failure had more to do with motivation than technique. Still, I never had an intuitive grasp of what accounting is about. Recently I've also started wondering whether accountants themselves really know why they're doing it the way they do, either.

My favourite example is double-entry bookkeeping. Just about every source I've ever consulted tells me that its raison d'etre is that it serves as a kind of primitive error correction scheme. Well, it sure does that, but why do people keep on using that sort of primitive in the age of computers? Some sources additionally suggest that there is a practical benefit to being able to subtract from an account by using the credit column or to repeating numbers across accounts without sign changes, but those are really just another way to say the same thing. It doesn't get us around subtracting from one account and adding to another, which is the more basic description of double-entry.

In this one, precise case the likeliest explanation dawned on me thanks to my ample use of alcohol.

At the time I was dating someone who lived in a commune. That commune had a common liquor cabinet, with more or less free access as long as any drain was eventually cleared with the owner. The result was a much more varied, practically inexhaustible and eminently available/convenient cabinet for everybody.

As I became to be accepted as a permanent fixture of the communal life, I was granted my own box in the diagram, and due to my thirst, quickly became adept at keeping tabs on my usage. That bookkeeping went through a couple of revisions, but eventually settled in a form where you tallied a standardized shot ("ravintola-annos") on 1) whose bottles you touched, and also 2) your own name. That way both who suffered the blow and who should be the one to compensate were recorded. On one tipsy night I then finally grasped the connection: what we had there was a picture-perfect double-entry accounting using a single account, which just happened to be in base one so that the analogy didn't show as easily as it otherwise would have. And still we pretty much never balanced the book, so that that couldn't have been why we really went with to columns to begin with. (In case you wonder, yes, there was a price premium above buying cost; this commune had little to do with communism.)

The real reason was that we had a multiple input, multiple output stock, where only the aggregate balances accrued mattered. Each transaction needed to go from a single owner of a bottle to a single consumer of a drink, but that was only a mechanism which maintained the constraint that every shot eventually had to be paid for by someone. The real beef was that the aggregate contribution to and withdrawal from the cabinet needed to be kept in check; every transaction basically lost its meaning after those sums had been updated. The stock, it was there in order to permit us to share efficiencies of scale, and the numbers were there to account for aggregate inflows and outflows which helped maintain that beneficial scale.

This is exactly what happens in firms. They have multiple inputs and multiple outputs. From the accounting perspective, all that matters are the sums total of incoming and outgoing money flows. (Or vice versa material flows, if you want to do some kind of materials accounting as well.) In theory you could treat the finance of a large multinational using a matrix of all-inputs vs. all-outputs, sure, but you really don't want to be doing that with even a dozen accounts when what you're actually dealing withis an additive, homogeneous, non-perishable thing like money. You're only interested in what goes in and what comes out in toto. So that is the basis you will choose, input-output=balance, and since every singular transaction you do influences both, you'll have to incrementally maintain those numbers in two different places. Voila: double-entries.

P.S. There are still at least three things unaccounted for, if you pardon the pun. First, journls do exist. They do so for, let's say, forensic purposes. They record the transactions so that if the abstraction that only sum inputs and outputs matter somehow falls apart, we can still get at the details. This could be if the inherent error check double-entry affords us signals an error, doubly so in case there has been intentional fraud, and then on the other hand so that we can also perform closer analysis on the disaggregated flow of transactions (todays called OLAP).

Second, why have multiple accounts? That' s because only homogeneous stocks can be reasonably tracked in the sum-in, sum-out manner: you can have an account in money, but not one in money plus steel, or one in yens plus dollars. When we want to make finer distinctions, we usually require that certain sorts of transactions going out from account a have to go to account b and not account c. That's a rudimentary means of business analytics: the sums on each account tell us how we're doing with its underlying stock, even if the account does not denote anything physical at all. Double-entry then helps us even further, there: you only need to consider the accounts/stocks-tracked relevant to your current task.

And third, why do we still have this system when in principle we could calculate all of the data on the fly from the general journal? This can be explained as a form of precalculation and caching, which enables 1) distributed, asynchronous and write-only maintenance of the relevant balances, 2) early availability of the aggregates because of that, and 3) enables local analysis of aggregate inflow and outflow in the absence of access to a central repository of data.

2009-12-10

The improperness of improper priors

Over the past ten of days or so I've once again been diving into Bayesian statistics; let us say I'm experiencing a serious, personal paradigm shift wrt statistical inference. My main starting point as a practicing database guy is the easy correspondence between embedded multivalued dependency (EMVD) on the one hand and conditional independence (CI) in Bayesian networks on the other—EMVD has for the first time made the basic ideas of BN's accessible to me at the intuitive level, and of course it's pretty nice in other ways, since we're now only talking about the easy, finite, always continuous cases.

Still, you have to mind the infinite frame of mind as well. And since I happen to think like I do, I'm from the start strongly attached to the objective Bayesian viewpoint, in preference to the more conventional subjective one. In fact, my revival is intimately tied with my finally having learned that the Bayesian framework can also be described in purely objective, information theoretical, measurement-of-ignorance terms instead of vague references to "degrees of belief".

Here, the nastiest counter-example seems to be the problem with unnormalized (improper) priors, and the subsequent marginalization paradox which is absent from the theory dealing purely with proper priors/normalized probability measures. At least to me it implies that there might not be a coherent description of complete uncertainty with respect to the Bayesian framework. That is rather bad, because evenas we already know that Bayes's theorem is just about the neatest framework for consodlidating uncertain information in a provably coherent way (no Dutch Book! eventual stabilization among a group of Bayesian learners with shared priors, modulo common knowledge concerns and the like! a neat generalization of Popperian falsificationism!!!), we do always need a coherent starting point which has an objective, not a purely subjective, interpretation.

Now, I had a little bit of an intuitive flash there, as I'm prone to. While it is true that we cannot normalize many of the most natural "distributions" that would go along with common improper priors, perhaps that has less to do with the impossibility of bringing formal rigor to bear to them than we might think. I mean, sure, we cannot even make the simplest of such priors, the flat one, normalize into a probability measure in the infinite base set case; not even using the theory of general distributions. But sure enough we can make it work if we let the prior become a general linear functional, restricted to a class of arguments where it is continuous.

So, maybe the marginalization problem, or the common use of improper priors, wasn't so much about the impossibility of representing noninformative priors "cleanly", after all. Maybe it was just about our choice of representation?

I haven't gone through the particularities, but I have a strong sense that this sort of approach could lead to a natural, structural encoding of the special nature of not-knowing-shit versus sorta-probabilistically-knowing-something—structural restrictions wrt the resulting operator algebra would simply make certain kinds of calculations inadmissible, those restrictions would propagate in the intuitively proper manner through things like Bayes's rule, and things that manifest themselves as the marginalization paradox (or others alike it?) would probably be forced out into the open as topological limitations in the compatibility of operators which act not only on distributions proper, but the dual space as well. In particular, Bayes's rule with the usual pointwise limit interpretation would only apply to the density function side of things, and would probably be qualified in case of functional/function, and certainly functional/functional, interactions (e.g. you can't reasonably deal with products of functions and functionals, you always have to go to the inner product, i.e. in conventional terms marginalize when both are present; and in the case of functionals, the topology of the dual function space is rather different from the conventional one, seriously affecting the theory of integration).