Nuo tiedostoformaatit aiheuttavat hieman pohdintaa... itse pyörittelen Linuxin ja Windowsin kanssa. Olen aika usein pyrkinyt tuohon utf-8, se näyttäisi toimivan hyvin. Jostain ymmärsin, että olisi "paras" merkistö...?
Nämä UTF-8 liittyvät löysin Survon NEWSista (LINEDEL + DEL_SAVE):
SAVE UTF / Deleted lines
- PRINT has now new control operation ENCODING (example usage: - encoding UTF-8 )
- Specification RAWOUTFILE=out.txt for RISKSIMU to output raw bootstrap data
- RPLOT now uses UTF-8 encoding explicitly
- U key to switch to UTF-8 in SHOW
- If default Tcl/Tk clipboard fetching returns a zero length STRING, contents are fetched again using type UTF8_STRING
- ENCODING specification for SAVEP/W/U and LOADP/W/U (Example: ENCODING=UTF-8)
Olen itse käyttänyt
ENCODING=UTF-8 SAVEP ja FILE LOAD yhteydessä. Lähinnä kun olen siirtänyt tekstiä tai tekstitiedostoa esim. R:ään tai Pythoniin.
Tuo PRINT (UTF-8) olisi myös hyödyllinen, kun teen html-tiedostot PRINTillä.
Aiheesta voisi keskustella enemmänkin Survo R:ssä.
Huomaan, että itselläni välillä tulee hankaluuksia noiden kanssa. Alkuperäiset datat saattavat olla jotain UTF-16 tms.
Survo R:ssä on komento:
CODES REMOVE utf16file.csv,file2.csv,STEP,2 /
Joka auttaa tiettyihin merkistöihin (poistaa joka toisen tarpeettoman merkin).
Kun hyppelee Linuxin ja Windowsin välillä, niin olisi kiva löytää selkeys, mutta olen ymmärtänyt, että merkistöt ovat aikamoinen riesa koodaajille :)