?

Log in

Linux и зоопарк кодировок

В связи с версткой некоторой книги встала задача. Есть комп под Linux. На нем есть папка, в которой лежит n текстовых файлов. Файлы в нескольких кодировках, надо привести их все к системной utf8, для дальнейшего скармливания тому самому LaTeX. Поскольку n > 50, вариант вручную не обсуждается.

В этих ваших интернетах решения не нашлось, поэтому выкладываю свое тут.

[Код и комментарии]
#!/bin/bash

for filename in *
do
    #выясняем кодировку очередного файла
    encdata=$(file --mime $filename)

    #убираем из ответа предыдущей команды ненужную информацию
    encdata=${encdata#*=}
    
    #варьируем поведение iconv в зависимости от ответа file
    #хотелось бы обойтись без ветвления и использовать encdata напрямую,
    #но, к сожалению, file --mime не всегда выдает адекватные ответы
    case "$encdata" in
        unknown-8bit|iso-8859-1)
            iconv -f cp1251 $filename > $filename.utf8
            ;;
        utf-8)
            cp $filename $filename.utf8
            ;;
        *)
            iconv -f $encdata $filename > $filename.utf8
            ;;
    esac
done




Ныне же, господа отци и братья, аще ся где буду описалъ, или переписалъ, или недописалъ, то чтите исправливая, а не клените, слышаще Паула апостола, глаголюща «благословите, а не клените». А иже чтетъ, буди ми в молитвахъ.

Метки:


2 фев, 2013

Все-таки великая вещь LaTeX. Команды \flushleft и \raggedright делают одно и то же — выравнивают текст по левой стороне. Но они делают это по-разному!

А говорят, в точных науках синонимия невозможна :-)

18 янв, 2013

Интересно, откуда всякие занятные людишки берут суммы зарплат в РГГУ. У меня сохранилась справка 2-НДФЛ, взятая в сентябре, а потом не пригодившаяся. Так зарплата, в ней показанная, составляет 12 021 руб. 80 коп. До 29 тыс., упомянутых в тексте по ссылке, как до Шанхая.

(я даже в Вышке меньше получаю :-) )

Нет, ну правда... На сайте Ленинки в форму поиска добавили ссылку «Где купить», а в выдаче еще, к тому же, отправляют на б-гомерзкий книгафонд и копирастический литрес.

Я конечно понимаю, что в наши времена хочется монетизировать каждый чих, но не мелковат ли масштаб для национальной библиотеки?

копирую кусок из своей переписки с одной коллегой насчет конторы под названием Lambert Academic Press.

Итак


(1) согласно ГОСТ 7.60—2003 издание это документ,
1. предназначенный для распространения содержащейся в нем информации
2. прошедший редакционно-издательскую обработку
3. самостоятельно оформленный
4. имеющий выходные сведения

(2) По позициям 1, 3, 4 вышеприведенной дефиниции с LAP все о'кей. Однако редакционно-издательская обработка предполагает, как минимум, одно из трех
1. научное рецензирование (в идеале анонимное, но м.б. и попроще, хотя бы РИСО)
2. редактуру
3. корректуру и верстку

(3) Очевидно, что продукция фирмы LAP не проходит ни один из трех указанных в пункте (2) этапов, а значит и не соответствует определению, приведенному в пункте (1).


Короче говоря, издаться через LAP невозможно по определению (букве закона тож).

AMIRIGHT?

Метки:


М*динский такой м*динский... (via ув. maoist)

Особенно потрясает цинизм прилагаемого документа. Оказывается, наличие в подлежащем реформированию заведении своих кадров со своим представлением о жизни, это риск проекта (c. 7). А когда людей выдавливают с должностей, это необременительные схемы оптимизации штатного расписания (ibid). «Хорошо излагает, собака» — шепнул Остап на ухо Ипполиту Матвеевичу...

Еще вот хорошо: «содание условий (легитимных схем) запуска инвестиционных проектов» (на базе музея, ne l'oublions pas...). Вижу подготовку комплекса поправок в законы о Государственном архивном, библиотечном и музейном фонде РФ, вижу тебя, Владимир Ростиславович, на коне, вижу славу твою, славу Герострата...

Какая б цыганка ему казенный дом нагадала... Эх, не в этой жизни...

Надо признать, что вчера ФБ сменил гнев на милость и мой аккаунт разблокировали. Так что предыдущее отменяется. По уму бы свалить оттуда, да ладно.

Метки:


Официальное

TWIMC

Настоящим официально заявляю, что как минимум с 17-го августа я не имею доступа к аккаунту в Facebook, подписанному моим именем и сопровождаемому моей фотографией. Причина — в неработоспособности их механизма проверки безопасности и отсутствии у этой дурацкой конторы нормального саппорта с живыми людьми на противоположном конце провода. Многократные обращения в ТП с помощью предлагаемых форм взаимодействия не дали никаких результатов, а мыла или телефона у них нет (бедняжечки...). Если после указанной даты под моим именем производятся какие-либо действия, то ЭТО НЕ Я. Всю ответственность за поведение моей вырвавшейся на свободу тени прошу возлагать на г-на Цукерберга лично.

И ведь главное, понимал же когда регался: игрушка не только дурацкая, но и чреватая. Так и вышло :-)
Отменяется.

UPD теоретико-гуманитарной направленности
Как удалось выяснить из немногих полученных от абузы ответов, доступ мне отрубили, сочтя, что аккаунт фейковый. Интересно обсудить критерии неверблюдности, которыми пользуется ФБшный робот. Может, просветите, кто знает...

Метки:


Научный спам от фирмы LAP

В ходе исследования в НИУ ВШУ, я столкнулась с упоминанием о Вашей научной деятельности на тему "Этническое самосознание древнерусских летописцев XI—начала XII в".

Дальше можно не читать, имхо.

Метки:


21 авг, 2012

Я не всегда понимаю юмор художника Ёлкина, но сегодняшнее это зачот, однозначно.


Profile

1984 PC
dmdobrowolski
dmdobrowolski

Latest Month

Февраль 2013
Вс Пн Вт Ср Чт Пт Сб
     12
3456789
10111213141516
17181920212223
2425262728  

Метки

Syndicate

RSS Atom
Разработано LiveJournal.com
Designed by Lilia Ahner