Орто- и типографске недоумице

Пријавите се или се региструјте да бисте слали коментаре

23 одговора [Последњи унос]

Thu, 26/01/2012 - 00:39

Дундо

Није присутан

Придружио се: 25/06/2010

Ову тему намењујем онима који желе свој језик да обогате и улепшају, а потом то богатство и ту лепоту да поделе са другима на лако читљив и пријатан начин. Није ништа под морањем, није ништа обавезно, ко не воли и неће – нема љутње. Једино молим учеснике да у својим прилозима не праве никакве личне референце. Свака сличност са стварним догађајима и персонама нека буде чисто случајна.

Непосредни повод за покретање теме је недавна дискусија о ограничењу броја знакова у нашим порукама. Та дискусија задрла је и у питања форумског едитора, а могу да се очекују и још неке техничке недоумице. Не желећи да тиме оптерећујемо већ устаљене, уигране и омиљене „одељке“ нашег форума, потражио сам могућност да бројеве знакова и друга пратећа питања сместим у неки „одељак“ где ће се те дискусије лакше толерисати. Није ми остало ништа друго него да покренем један нов „одељак“ са сродном темом.

Тренутно ћу се задржати на дискусији о форумском едитору, пре свега у вези са ограниченим бројем знакова. Надам се (а то ми је и жеља) да ће овај период бити краткотрајан и да ћемо моћи да се посветимо више питањима правописа, граматике и типографије. Сигуран сам да на форуму имамо врло добре стручњаке за то.

Jan 26th, 2012 at 12:48 am

Дундо

Није присутан

Придружио се: 25/06/2010

Уношење текста у едитор

Копирање из Word-а у форумски едитор

Пре него што се упустим у детаље, даћу приоритет једном експерименту, чији резултати могу да буду корисни.

Узео сам своју поруку #32475, од 24. јануара, 23:24, страна 3248, коју сам написао у Word-у, без неких озбиљнијих форматирања, али, по свом обичају, користио фонт Verdana. Тај текст сам пребацио у форумски едитор на више начина, сваки пут сам „измерио“ дужину изворног текста и погледао како би та порука изгледала на форумској страници.

Прво копирање текста било је по старој навици, то јест директно из Word-а у прозор за писање текста. Фонт је остао Verdana. Дужина изворног текста 4708 знакова.

При другом копирању кликнуо сам иконицу W. Појавио се следећи прозор:

Деактивирао сам обе доње опције и пребацио текст у прозор. Фонт је остао Verdana, дужина изворног текста 2921. Осетно скраћење.

Поновио сам исто са активираном горњом опцијом. Фонт је пребачен на Palatino Linotype, дужина изворног текста 2711.

Исто то са активиране обе опције. Фонт је пребачен на Palatino Linotype, дужина изворног текста 2704.

Кликнуо сам иконицу Т. Пребачен је само текст, без икаквог форматирања. Едитор је додао само своје дефиниције неких знакова (различито од Јуникод-кодова). Дужина изворног текста 2385. Ово је управо симулација писања текста директно у прозору форумског едитора.

После претходног корака изабрао сам у форумском едитору фонт Verdana и величину слова small, чиме сам дошао на исти резултат као у почетку, с тим што се дужина изворног текста незнатно попела на 2467 знакова. Дошао сам скоро на половину вредности коју сам имао у почетку.

Напомињем да се овде радило о монотоном тексту без много форматирања, али такви текстови су најчешћи. При свим покушајима копирања мој текст се надовезивао на текст цитата, управо онако како је моја порука #32475 у стварности изгледала.

(Овај текст у Word-у има 1914 знакова).

Jan 29th, 2012 at 10:05 pm

Дундо

Није присутан

Придружио се: 25/06/2010

Смајли

Тренутно нема више ограничења дужине текстова, па сматрам да дискусије о томе нису више хитне.

Нисам мишљења да не треба да водимо рачуна о рационалном коришћењу капацитета и способности сервера и форумског софтвера. Зато неће бити лоше да повремено размислимо о томе, чиме можемо ми сами да допринесемо неометаном раду форума и ређим сусретима са неомиљеним ERROR. У том смислу биће корисно ако се појаве још који прилози на тему елегантнијег коришћења едитора.

Кад га већ имам „у руци“, да приложим пример изворног текста једног малецког смајлића:

123 знака! Није чудо што пуноглавац прави тужно лице.

Mar 30th, 2012 at 6:54 pm

Дундо

Није присутан

Придружио се: 25/06/2010

Мало правописа

Множина именице знак

Припремам неколико „есеја“ о знацима (словима, цифрама и сл.) и хтео сам да рашчистим са питањем деклинације множине именице знак. Послужио сам се Правописним речником српског језика од Милана Шипке (Прометеј, Нови Сад 2010.)

Номинатив множине именице зна̑к је зна̑ци, генитив зна́ка̄, датив зна̑цима итд. Друга варијанта је: номинатив зна̏кови, генитив зна̏ко̄ва̄ итд. Пошто није означен никакав приоритет, закључујем да може да се бира.

Одлучио сам се за прву варијанту, а трудићу се да генитив множине пишем са акцентом, да би се разликовао од једнине.

Морам да признам да сам са својим београдским акцентом наглашавао бар неке од горњих падежа погрешно. Зна̏ко̄ва̄ не бих ни сад умео да изговорим.

Apr 7th, 2012 at 9:42 pm

Дундо

Није присутан

Придружио се: 25/06/2010

Узгред забележено

Путем алфанумеричких кодова:

Од оптичког телеграфа

до Уникода

Већ у давна времена поједине информације су се преносиле на даљину претежно оптичким путем. Поред једноставних знáка рукама и разним предметима, користила се и ватра за светлосне и димске сигнале. На овај начин могли су да се пренесу разни договорени појмови, али не и неки текст са сложенијим значењем. Тек 1792. године успео је Француз Клод Шап (Claude Chappe) да оствари систем оптичке телеграфије за пренос било каквих текстова и бројева на велика удаљења. Зависно од терена, било је више или мање „релејних станица“ званих семафори, које су примљене сигнале слале даље. Тако је, на пример, између Париза и Лила, са 22 семафора остварена веза дуга 270 km.

Реплика семафора по систему Клода Шапа (извор: Википедија)

Семафор је имао два обртна „крила“ на једној попречној греди. Крила су имала по 7 различитих положаја, а и попречна греда је заузимала различите положаје. Према подацима у литератури остваривало се 196 независних комбинација односно кодова за знаке. Касније ћемо видети да је ово био завидан број различитих знáка који су могли да се пренесу.

При својим ратним походима Наполеон Бонапарта је богато користио оптичку телеграфију са семафорима и линије ове телеграфије су биле изграђене по многим деловима Европе. Како је свако могао да „прочита“ телеграфске поруке, Наполеонови стручњаци су измислили шифрирање.

Увођењем Морзеових кодова средином 19. века потиснут је Шапов систем. Захваљујући томе што су за Морзеов систем могли да се користе разни светлосни и звучни извори, а касније и електрични, тај систем се одржао и до данас, наравно ограничен на посебне области примене. Остварењем преноса електричних импулса почиње нова ера телеграфа. Комбинацијом краћих и дужих импулса могли су Морзеови кодови да се пренесу директно на велике даљине, независно од доба дана и атмосферских прилика. Штавише, убрзо су пријемни апарати могли те импулсе да запишу на папирну траку, чиме се добијао и писмени документ пренете информације. Ипак, била је потребна посебна обука за слање и читање порука јер су кодови били неразумљиви за обичне људе. Зато се радило ужурбано на проналажењу система који би омогућили аутоматско кодирање и декодирање текстова.

Вредно је забележити постојање телеграфских уређаја са казаљком.

Пошиљалац је окретао ручицу на поједине знаке, апарат је слао кодове у линију, а на пријемној страни апарат је аутоматски показивао казаљком на примљене знаке (извор: Википедија)

Посебан понос фирме Siemens био је овај апарат из 1847. на којем је било довољно да пошиљалац притиска дирке (извор: Википедија)

Нажалост, нисам нашао у литератури податке о томе које кодове је користила телеграфија са казаљкама. Недостатак је био свакако у немогућности израде аутоматских записа примљених докумената, што је у међувремену постао важан задатак телеграфије.

(Наставља се)

Apr 7th, 2012 at 9:57 pm

Дундо

Није присутан

Придружио се: 25/06/2010

Узгред забележено

Од оптичког телеграфа

до Уникода (2)

Већ пред крај 19. века Француз Jean-Maurice-Émile Baudot је измислио перфорирану траку за записивање текстова за потребе телеграфије. Перфорација је била у редовима од по једне мале и максимално пет већих рупица. Мале рупице су служиле само за транспорт траке, а комбинације већих рупица дефинисале су алфанумеричке кодове, односно текст који се телеграфише. Оператор одашиљача је имао пред собом једну „клавијатуру“ од пет дирки и, зависно од тога које дирке су притиснуте, одговарајуће иглице су перфорирале траку. При одашиљању телеграма свака рупица је иницирала електрични импулс и на пријемној страни апарат је производио перфорирану траку која је била истоветна као и она на одашиљачу. Трака је могла да се чита голим оком, а било је и апарата који су одмах (у једном реду на траци) одштампали текст.

Перфориране траке са алфанумеричким кодовима. Лево трака по систему Бодо са пет, десно савремена трака са осам кодних рупица (извор: Википедија)

Систем са пет рупица омогућавао је највише 32 различите комбинације, тако да су морале да се користе две таблице (равни) кодова, тј. да се сваки час прелази с једне на другу. Бодоов систем кодова је нешто касније био стандардизован, назван ITA1 (International Telegraph Alphabet No. 1) и, поред недостатака, одржао се све до тридесетих година прошлог века. Може се слободно рећи да је Бодо поставио камен темељац данашњем дигиталном преносу и записивању информација.

Таблице кодова ITA1

1932. године прерађен је Бодоов систем у један новији, ITA2. У суштини, овај се није много разликовао од ITA1, али више је одговарао новијој техници која се за нешто више од једног века доста изменила. Убачене су нове команде, од којих су најважније прелаз у следећи ред (line feed) и враћање „ваљка“ на почетак реда (carriage return). Захваљујући овим командама примљени текст је могао да се штампа на листу хартије, исто као на машини за писање. Осим тога, кодови су били „вредновани“ по утрошку енергије и хабању машина: најчешће коришћени знаци (на пример Е, Т или белина) имали су само по једну рупицу. ITA2 се користи и данас и није сасвим избачен из употребе.

Горе поменути кодни системи имали су врло мали број знáка у поређењу са оним што је већ у првој половини прошлог века било потребно за пренос информација. Већ и сама чињеница да су ITA1 и ITA2 имали само велика латинична слова ограничавала је коришћење ових система само за „брзојаве“. За посебне потребе и прохтеве морали су да се развију неки бољи системи. Поменућемо као пример коришћење телеграфије за даљинско управљање словослагачким машинама у штампаријама новина и часописа који су се истовремено штампали на више места земљине кугле. Да би се обухватила и мала и велика слова, као и маса других знáка који су се користили у штампаријама, уведена је и шеста рупица (шести бит) у перфорираним кодовима. Организацијом кодова у две равни по угледу на писаће машине (са притиснутим или опуштеним shift-тастером) могли су да се пренесу сви знаци и команде који су били потребни на пример линотип-машинама. Штавише било је и извесних могућности форматирања текста.

У то време великих улагања у развитак технике тешко је могао неко да замисли да ће у 21. веку коришћење само малих или само великих слова од стране појединаца бити отмено, very cool.

Нисам наишао на поуздане податке, већ само на индиције за увођење и седме рупице (седмог бита) већ тридесетих година прошлог века. Пошто се увођењем сваке нове рупице удвостручава број могућности, то би значило да би могао да се постигне исти ефекат као и код система са 6 рупица у две равни. Касније ћемо видети да је управо систем кодова са по 7 рупица имао кључну улогу у савременом преносу информација.

Велик проблем представљала су и различита писма. До сад смо говорили само о основном алфабету латинице. И стварно, није се узимало у обзир колики део живља на Земљи користи ћирилицу или неко друго писмо сем латинице.

Део Земљине површине на којем се користи ћирилица (извор: Википедија)

Тек 1963. године СССР је проширио кодни систем ITA2 тиме што је убацио још једну раван са ћириличним словима и тај нови кодни систем једноставно назвао МТК-2 (международный телеграфный код 2). Тешко је замислити да Руси нису користили ћирилицу у телеграфу већ много раније, бар за унутрашњи саобраћај, али овим кораком свакако је скренута пажња светске „латиничне“ јавности на то, да милиони људи користе и ћирилицу и да ти милиони постају интересантно тржиште (ако већ ништа друго).

(Наставља се)

Apr 7th, 2012 at 10:07 pm

Дундо

Није присутан

Придружио се: 25/06/2010

Узгред забележено

Од оптичког телеграфа

до Уникода (3)

Увођењем таблица кодова за седам рупица на перфорираној траци и једној равни (регистру) указала се потреба за завођењем неког логичног реда у распореду знáка. Најлогичније је било нумерисање знáка. Како су се информације састојале из низова „ћелија“ које су могле да имају само два стања (уопштено: има/нема, јесте/није, светли/не светли, дими/не дими, и сл. — у математици 1/0), усвојен је бинарни систем Готфрида Лајбница, развијен већ 1679. године, који се и данас свестрано користи у дигиталној техници. Полазећи (по навици) од тога да се најмањи елемент графичке представе неког броја налази на десној страни, ћелије у низу се вреднују на следећи начин:

. . .

Пада у очи, да свака следећа ћелија (гледано с десна на лево) има двоструку вредност од претходне. Збиром вредности ћелија са стањем да (пробушена рупица) односно 1 (стручно математичарски) добија се укупна вредност низа ћелија одн. бинарног броја. Тако, на пример, бинарни број 1101011 има децималну вредност

64 + 32 + 8 + 2 + 1 = 107.

Из практичких разлога математичари су „упростили“ графичку представу бинарних бројева тиме што су груписали цифре у „пакете“ од по четири комада (зване нибл) и те пакете замењивали једном цифром. Очигледно је да један нибл може да има вредности од 0 до 15. Зато је уведен систем цифара 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, А, B, C, D, E, F. Према томе, наш горњи бинарни пример 1101011 био би подељен на ниблове 0110 и 1011, односно 6 и B, заједно написано 6В. Ови бројеви названи су хексадецималним јер имају основу 16 уместо 10.

На нашу велику жалост информатичари су прихватили хексадецималан систем бројева и на још већу жалост примењују га упорно на таблице кодова знáка и фонтова. Из ових разлога морао сам овде, макар површно, да дотакнем хексадецималне бројеве. У даљим излагањима сретаћемо се скоро искључиво са њима. Мало више детаља може да се нађе у чланку

http://www.file-upload.net/download-4180345/Hex.pdf.html

Техника телепринтера све је више занимала математичаре и информатичаре, тако да је амерички математичар Џон Таки (John Tukey), већ 40-их година прошлог века, увео појам бит за рупицу на перфорираној траци, односно за цифру бинарног броја. Претпоставља се да је то кофер-реч од binary digit' или binary unit. 1956. године Вернер Бухолц (Werner Buchholz) уводи појам бајт (byte) за групу битова који дефинишу (кодирају) неки графички знак. Број битова у једном бајту није дефинисан. Као што смо видели, код Бодоа био је 5, код словослагачких машина 6, код каснијих телепринтера 7, да би се у току времена (код дигиталних рачунара) усталио на 8.

Убрзано усавршавање и повећање примене телепринтера условили су увођење седмобитних бајтова за кодове слова, цифара и знáка интерпункције. Ово је пружало могућност 128 различитих дефиниција кодова, али захтевало и потребу неког строгог и логичног реда у таблици кодова. Таблица кодова подељена је на 8 редова са по 16 кодова. У прва два реда смештене су команде (без графичких знáка) за извршавање појединих радњи телепринтера и за потребе инентификација и споразумевања у процесу успостављања и одржавања телеграфских веза. Трећи ред садржавао је белину, неке посебне знаке и знаке интерпункције итд. Сваки код је имао свој редни број.

Следећа таблица приказује распоред знáка за кодне бројеве од 32 до 126:

Тај распоред су Американци касније (1963.) стандардизовали и назвали га ASCII (American Standard Code for Information Interchange). У пракси се изговара једноставно аски и остао је све до данас у употреби у преносу информација (укључујући и компјутере).

Кодни распоред ASCII за седмобитни бајт (извор: Википедија)

Пада у очи да су велика и мала слова сређена алфабетски и понављају се на истим местима, померена за два реда. Можда је то један од разлога за коришћење искључиво хексадецималног система у таблицама кодова, али боље да не расправљамо на овом месту шта је узрок, а шта последица.

На горњем примеру види се како је ASCII-кодирање изгледало на перфорираној траци. Рекли смо већ да је кодни број збир вредности отворених рупица. W, на пример, има децимални број 87, i 105, k 107 итд. Овде се виде и кодови команди за враћање „ваљка“ Carriage Return (13) и нов ред Line Feed (10). (извор: Википедија)

(Наставља се)

Apr 7th, 2012 at 10:17 pm

Дундо

Није присутан

Придружио се: 25/06/2010

Узгред забележено

Од оптичког телеграфа

до Уникода (4)

Узгред речено, у телеграфији је био предвиђен и осми бит. Нигде нисам наишао на конкретне податке чему је он требао да служи. Као студент учио сам да се радило на неком систему откривања и одстрањивања грешака у преносу информација. Не знам да ли је осми бит требао да служи том систему. Било како било, касније се говорило о „ослобађању“ осмог бита, што би значило да се за њега налазила много кориснија примена од оне прве.

Као што и само име каже, ASCII је прилагођен првенствено америчким потребама. Није чудо шро је он изазвао критике, али пре свега завист у другим земљама. Скоро свака земља „старе“ Европе има своја додатна слова, најчешће латинична са дијакритичким додацима (да не говоримо о оној половини Европе која се не служи латиницом). Појавиле су се и друге таблице кодова (срећом по угледу на ASCII), па је претила опасност нове „Вавилонске куле“. Ипак ASCII је уживао велик углед и утицао на то, да национални стандарди не одступају много од њега. Поједине земље су за своја „словца“ узимале кодове неких ређе коришћених знáка, као што су „[“, „]“, „{“, „}“ и сл.

Да би се стало на пут произвољности у националним таблицама кодова, 1972. године израђен је међународни стандард ISO/IEC 646, који се сатојао од једног костура базираног на ASCII-стандарду, са предвиђеним местима за кодове националних варијанти. Вероватно се на овај међународни стандард не би тако дуго чекало да се Совјетски Савез није противио стандардизацији знака „$“ на хексадецималном месту 24 одн. са децималним бројем 36. У међународној телеграфској варијанти знак „$“ је замењен знаком „¤“, а свака нација је могла да за своју варијанту изабере шта жели. Знак „¤“ прихватили су СССР и његови сателити, остали су се одлучили за „$“. Овај детињасти детаљ не би био ни интересантан ни важан, кад не би илустровао тешкоће при стварању међународних стандарда.

Једна од варијанти ISO/IEC 646 је и такозвани YUSCII (Yugoslav Standard Code for Information Interchange) за потребе Југославије. У ћириличној верзији латинична слова замењена су одговарајућим ћириличним, а специфична српска слова убачена су на места неупотребљених латиничних слова и неких знáка интерпункције. И данас су у употреби многи компјутерски фонтови ћирилице по стандарду YUSCII. „Важност“ ове варијанте задрла је дубоко у деведесете године прошлог века, па је проглашењем назависности Хрватске проглашена и национална варијанта CROSCII (наравно само за латиницу).

Југословенска национална варијанта ISО/IEC 646 звана YUSCII (ћирилица и латиница). (извор: Википедија)

Телепринтери и друге направе за одштампавање одн. „откуцавање“ текстова имале су ограничен број знáка, чије шаре (глифови) су биле механички „изрезбарене“ и смештене на полугама, лоптама, или дисковима, тако да је једна машина могла да се користи претежно за једно одређено писмо. Развојем рачунарске технике прешло се на такозване матричне штампаче. Шаре (глифови) су се формирале тачкицама у пољу једне матрице, у почетку 8 х 8 елемената, а касније и више. Штампачи су тачкице штампали иглицама, ситним капљицама мастила или прашком који се хватао на једној местимично наелектрисаној селенској плочи. Брзим развојем технологије штампања постигло се то, да је један штампач могао да штампа неограничен број различитих знáка, разне величине и стилове.

Најкасније на овом месту морамо привремено да напустимо телеграф и да се окренемо рачунарској техници. Пошто је бајт у рачунарској техници имао 8 битова, то је осми бит уведен и у таблице кодова знáка. Тиме је поново удвостручен број независних могућности кодовања, тако да су таблице кодова могле да се поделе у два дела. По свему судећи, фирма WANG је већ седамдесетих година за своје машине за обраду текста саставила прве таблице кодова за осмобитне бајтове. Први део био је идентичан са ASCII-распоредом, а покушало се да се знаци осталих нација, као и бројни графички знаци за прављење табела сместе у други део. По речима Била Гејтса, осамдесетих година IBM преузима ове таблице кодова и лансира их успешно као врло популарне DOS-кодове.

Прохтеви су се повећавали па и осмобитни бајт није могао да обухвати све жељене знаке. Већ почетком осамдесетих година фирма IBM усавршава DOS-таблице тиме што саставља 18 „страна“ (codepages) за разна писма и језике. Codepage 437 је основни, за потребе Американаца, 850 је западноевропску (укључујући Гајеву) латиницу, 855 садржи ћирилицу.

Codepage DOS 437 која је истовремено и основна и највише коришћена страница DOS-кодова, нарочито у почетној фази развоја компјутера и машина за обраду текстова. Прва два реда, исто као код ASCII-таблица, садрже примарно кодове за команде (овде нису обележени), а секундарно и неке (по речима Била Гејтса веселе) знаке који, после одређене команде штампачу, могу да се одштампају.

Codepage DOS 855 са ћириличним словима (извор: Википедија)

Codepage 855 садржи, уместо бројних знáка западноевропских писама, ћирилицу за потребе Руса, Срба, Бугара и Македонаца. Ћирилична слова су распоређена прилично хаотично. У време највеће употребе DOS-таблица ову страницу користили су углавном Руси, па је за њих израђена Codepage 866 са чисто руским словима и већим бројем других знáка уместо „балканских“ слова.

(Наставља се)

Apr 7th, 2012 at 10:24 pm

Дундо

Није присутан

Придружио се: 25/06/2010

Узгред забележено

Од оптичког телеграфа

до Уникода (5)

Деведесетих година распореди осмобитних кодова решени су у стандарду ISO/IEC 8859 са 16 делова. За ћирилицу је важио део 5, за Гајеву латиницу делови 2 и 16.

Таблица кодова ISO-8859-5 за ћирилицу (извор: Википедија)

Код горње таблице кодова пада у очи да се у редовима 8... и 9... опет налазе неке команде. Искуство је показало да се оне скоро уопште не користе. Мајкрософт је, видевши у разним алфабетима и писмима могућности проширења тржишта и спровођење неке врсте глобализације, мало изменио таблице ISO-8859 и наденуо им име Windows-Codepages. Те заблице одступају мало од ISO-8859, пре свега у томе што се у редовима 8... и 9... уместо команди налазе додатни знаци који могу да се штампају. Разумљиво је да су Windows-Codepages у пракси потиснуле ISO-8859. За наше прилике користе се странице 1250 (средњеевропски) и 1251 (ћирилични знаци).

Кодни распоред Windows-1251 са ћирилицом (извор: Википедија)

Пред крај овог трновитог пута не треба да се чудимо што ћемо у менију неког софтвера да нађемо и опцију „кодирање“ или с неким сличним именом, која треба да нам помогне да уместо неких неразумљивих знáка видимо разумљив текст. А кад кликнемо ту опцију указаће нам се велик списак разних могућности (само за ћирилицу пет или шест). Ако имамо среће, једна од тих могућности ће нас довести до доброг резултата. Нажалост, често се дешава да ни једна тачка подменија не помаже. У информатици је до недавно владао велик хаос и скоро свака већа фирма је имала своје „стандарде“ за кодирање знáка.

Горе смо забележили само неке најважније кораке у историји кодних распореда, кораке чијих последица још ни данас не можемо да се ослободимо. Информатичари и телеграфисти би још дуго тапкали у месту иживљавајући се новим кодним таблицама да се није нашао један паметан човек. Џозеф Бекер из фирме XEROX је већ 1988. године предложио да се дигитални кодови дефинишу помоћу два бајта, тј. 16 битова. Тиме би се добио број кодова, који би (према ондашњем схватању) био више него довољан за све постојеће знаке. Тако је 1991. године објављена прва верзија стандарда Уникод, која је кодирала све знаке Европе, блиског истока и Индије. Већ осам месеци касније број знáка се упетостручио, да би до данас достигао преко милион. Уникод је с правом назван Universal Character Set (UCS).

У пракси се убрзо увидело да су и два бајта недовољна да се сместе сви знаци који постоје у свету. С друге стране, нарочито при коришћењу основне латинице, довољан је још увек само један бајт, јер је први део кодне табеле (такозвани ASCII-део) остао непромењен. Зато је уведен један интелигентно смишљен формат кодова, UTF-8 (UCS Transformation Format за 8 битова). Укратко речено, за сваки знак из ASCII-дела (децимални кодови од 0 до 127) осми бит је нула. Та нула сигнализира да се код састоји само из једног бајта и да други бајт није потребан. За све кодове већих вредности осми бит је јединица и то сигнализира да је потребан већи број бајтова. Овај први постаје водећи, они за њим пратећи бајтови. Вредности седмог, шестог и петог бита водећег бајта казују колико бајтова има укупно (тренутно нема више од четири). Тако, на пример, водећи бајт 110ххххх значи да има укупно два, или бајт 1110хххх да има укупно три бајта. Сви пратећи бајтови имају облик 10хххххх. Битови обележени са „х“ одређују бројну вредност кода.

Одмах се види да је један број битова жртвован за информације о броју и врсти бајтова.

0ххххххх = ASCII-знак, само један бајт

110ххххх = водећи од укупно два бајта

1110хххх = водећи од укупно три бајта

.................

10хххххх = пратећи бајт.

Теоријски може да затреба већи број бајтова него у „крутом“ Уникод систему, али за „наше просторе“ није потребно више од два. Зато се једно велико подручје Земљине лопте опслужује једним бајтом. И, ако се деси грешка, да се при читању испусти један бајт, рачунар не прави папазјанију од следећих бајтова, него налази прикључак на следећем водећем бајту. Захваљујући овом формату долази до велике уштеде у времену и енергији у земљама где се користи латиница.

Фонтови, којима располажемо у Windows-у, имају само један релативно мали број знáка, а то су знаци који су у нашем окружењу потребни и довољни. Ти знаци су ипак сређени по Уникод систему. Уколико нам затреба нешто изузетно, морамо то да потражимо у богатијим или специјалним фонтовима. Званично има фонт Arial Unicode MS све знаке Уникода. Ово је мало вероватно, али може да се каже да тај фонт има све што уопште може да нам затреба. Од велике помоћи могу да буду и фонтови фонтови Lucida Sans Unicode и Code 2000. Не треба их избацивати из рачунара, а ако сте их већ избацили, наћи ћете их поново на интернету.

Да се подсетимо: за YUSCII кодни распоред био би и за ћирилична слова довољан само по један бајт. Постоји велик број ћириличних фонтова са кодним распоредом ISО/IEC 646 одн. YUSCII. Но, у 2012. години не можемо да очекујемо да и читаоци наших порука чувају YUSCII-фонтове у својим рачунарима.

◊◊◊

И, на крају, да се вратимо на телеграфију од које смо и пошли и којој дугујемо модеран систем преноса информација. Данас скоро да преовладава мишљење (пре свега у помодарском свету) да је интернет потпуно заменио телеграфију и да је телеграфија изумрла, постала сувишна. Та надменост није на месту. Није носталгија, али у одређеним областима живота и друштва телеграфија је још увек незамењива. Тековине наше цивилизације су прхке и крхке, сувише осетљиве на све што не иде по предвиђеним шаблонима. Где нам је у ратним приликама и у случају елементарних катастрофа интернет? Зато се пре свега војска чврсто држи класичног телеграфа. Телепринтери са перфорираним тракама још увек су врло сигурно средство. Наредба је наредба, не шаљу се смајлићи. Чак и у најкритичнијим условима користиће се бодљикава жица као телеграфски вод, уместо тастатуре жице ће се ручно спајати и раздвајати, а са друге стране примаће се Морзеови знаци на слух или вид. А кад неки брод тоне, послаће сигнале
∙∙∙ — — — ∙∙∙ . Свако дете зна да је то SOS.

Има још довољно и довољно разлога за опстанак класичне телеграфије.

Apr 9th, 2012 at 8:15 pm

Дундо

Није присутан

Придружио се: 25/06/2010

Малкице правописа

Генитивни знак

(са применом и на сажете самогласнике)

Генитивни знак (^) је знак интерпункције у српском језику (постоји и у осталим језицима насталим растакањем српскохрватског). Ставља се на последње слово да би се разликовао генитив множине од облика једнине, нпр. имам пријатељâ, подаци са институтâ, Ноћ музејâ. Са истом вредношћу се употребљава и водоравна црта (‾), знак дужине. Не треба стављати ове знаке када је јасно да се ради о облицима множине, нпр. плаката, молби или ако је то јасно из контекста реченице, нпр. имам доста пријатеља, подаци из свих института. Такође се ставља приликом сажимања самогласника, нпр. „Говори кô да ништа није јео“ или „Много сам се удебљô“. Погрешно је уместо генитивног знака користити широко распрострањени апостроф на тим местима: *„Говори к'о да ништа није јео“ и *„Много сам се удебљ'о“.^[1] Користи се и да нагласи поједине речи (обично предлоге), који могу имати двојако значење тако, на пример, у реченици „Молимо Вас, унесите исправан кôд при убацивању шаблона“, слово о је наглашено тако да се зна прави смисао речи. Док, код може значити и предлог. Нпр. „Скрени код поште улево, ту ја живим“. Постоје и други примери. Као „Сестра треба да ми дâ поклон“ и сл.

Генитивни знак није обавезан и може се и изоставити, као у горе наведеним примерима. Боље је избећи било какву ознаку него ставити апостроф који овде има погрешну функцију. Другим речима, сасвим је исправно написати: „Говори ко да ништа није јео“ и „Много сам се удебљо“ уместо у дате примере сажимање сугласника обележити апострофом.

^[1] астериск на почетку примера у лингвистици означава грешку.

Литература

Пешикан, Митар и сар. Правопис српскога језика, Матица српска, Нови Сад, 2010.
Клајн, Иван (четврто издање). Речник језичких недоумица, Чигоја штампа, Београд, 2002.

- Добављено из „http://sr.wikipedia.org/w/index.php?title=Genitivni_znak&oldid=4719663“

Знао сам за генитивни знак, али ипак сам пре неколико дана „усвојио“ писање знáка као генитив множине именице знак. Ово сам преузео из Правописног речника и сматрам да одговара правом нагласку.

Претпостављам да је генитивни знак „исконструисан“ као замена за знак дужине (‾) који се тешко поставља изнад неког слова. Генитивни знак (^) се пак користи у многим европским језицима, налази се на свакој тастатури и писаћој машини, а латинични самогласници са тим знаком присутни су скоро у сваком фонту. Не треба изгубити из вида да не може једноставно да се „направи“ изнад ћириличних слова „и“ и „у“ . Колико сам разумео, генитивни знак није обавезан. Но, и поред тога, кад нешто пишемо трудимо се да олакшамо читаоцу читање и резумевање нашег текста. Тако би бар требало да буде и мислим да се многи форумаши труде.

У једном од наредних прилога описаћу како се сви наши акценти (укључујући и знак дужине) стављају изнад ћириличних слова (ако затреба).

Ново за мене је правило да се приликом сажимања самогласника не користи апостроф, већ генитивни знак. До сад сам увек вредно стављао апостроф, чак уображавајући да сам урадио нешто „здраво“ правилно.

Apr 11th, 2012 at 5:54 pm

#10

Дундо

Није присутан

Придружио се: 25/06/2010

Има тога, има

…ШТАЈЕ ТУ СМЕШНО!!!…K

…НЕ ЋЕ ТЕ РЕЧ HNСТЕ РАЗУМЛN…J
…N ЗАЧЕГА ОНДАК ПРАВОПNС…!!!!!J

Тренутно на сајту

Пријављивање

Нове теме форума

Активне теме форума

Орто- и типографске недоумице

Претрага форума