среда, апреля 27, 2005

Еще два тематических списка

Размер
size, sizes, big, bigger, biggest, huge, hugest, great, greater, greatest, small, smaller, smallest, little, long, longer, longest, tall, tall, short, shorter, shortest


Дом, жилище
house, home, room, hall, hallway, wall, door, window, roof, floor, stair, flat, ceiling, bedroom

Тематические списки - небольшие дополнения

Несколько слов, которые ускользнули от моего внимания, когда я составляла тематические списки
Части тела - body, bodies
Время - old, older, new, tonight, soon

Немного статистики

Моя цель - составить что-то вроде "Словаря читателя любовного романа", отбирая для него слова по статистическому признаку, т.е. слова, наиболее часто встречающиеся в этих самых любовных романах (с использованием несколько тематических списков, о которых говорилось ранее). Для статистического отбора взяты 21 роман разных авторов, из разных под-жанров. (Принцип отбора - то, что было под рукой)
Вот их список:
Linda Howard - Dying to Please.txt
Amanda Quick - Ravished.txt
Amanda Quick - Affair.txt
Amanda Quick - Rendezvouz.txt
Jayne Ann Krentz - The Ties that Bind.txt
Jayne Ann Krentz - Soft Focus.txt
Jayne Ann Krentz - Eye Of Beholder.txt
Jayne Ann Krentz - Deep Waters.txt
Teresa Medeiros - [Lennox 2] - Touch of Enchantment.txt
Teresa Medeiros - [Lennox 1] - Breath of Magic.txt
Suzanne Brockmann - Troubleshooters 06 - Gone Too Far.txt
Suzanne Brockmann - TeamTen 02 - Forever Blue (v.1).txt
Suzanne Brockmann - TeamTen 01 - Prince Joe (v.1).txt
Mary Balogh - [Bedwyn 04] - Slightly Tempted.txt
Mary Balogh - [Bedwyn Series 01] - Slightly Married.txt
Mary Balogh - [Bedwyn Series 06] - Slightly Dangerous_v2.txt
Nora Roberts - The Villa.txt
Nora Roberts - MacGregors 2 - Alain~Grant.txt
Nora Roberts - MacGregors 1 - Serena Caine.txt
Linda Howard - Sarahs Child (v1)[html].txt
Linda Howard - After The Night.txt
Linda Howard - Dying to Please.txt

Теперь немного об используемых терминах - проще всего объяснить на примере
Token - любой набор букв, ограниченный пробелами или знаками препинания
Type (тип слова, я буду говорить просто "слово") - например, "привет, привет, пока" - это три tokens, но только два слова ("привет" и "пока")
Family (семейство) - это разные формы одного слова, например слова "you, your, yours, yourself, yourselves" - это одно семейство

Итак, статистика
В выбранных текстах имеем
2241538 tokens
39381 слов (types)
2516 семейств (их на самом деле несколько больше)

Вас такая статистика пугает? Бояться не стоит.
18578 (почти половина!!!) слов появляются только в каком-нибудь одном тексте. Велика вероятность, что это имена собственные, названия, опечатки, сокращения и т.п.
1166 (всего лишь) слов появляются во всех текстах. Если говорить о семействах, то это 940 семейств. Скорее всего, это и есть слова, несущие максимальную смысловую нагрузку.
5262 слова (2077 семейств) появляются в половине текстов. Так что получается, что словаря на пару тысяч словарных статей должно хватить, чтобы спокойно читать наши любимые любовные романы.
Теперь дело за малым - этот самый словарь составить.

четверг, апреля 07, 2005

Добавляем в словарь - чувства и эмоции

Любовный роман невозможен без проявления чувств и эмоций.
feeling, emotion, emotional
В первую очередь, это любовь во всех ее проявлениях:
love (loves, loved, loving), affection, affectionate, attachment, devotion, devote, crush, infatuation, obsession, obsessed, interest, like (likes, liked, liking), desire, desirable, lust, longing, craving, passion, passionate, adore, adorable, cherish, care, respect (respects, respected, respecting), admire (admires, admired, admiring), admirer, admiration
Не обойтись без проявлений любви:
kiss, caress, cuddle, fondle, hug, embrace
Конечно, не обойтись и без отрицательных эмоций
hatred, hate (hates, hated), dislike, detest (detests, detested, detesting), abhor (abhors, abhored, abhoring), abhorrence, disgust (disgusts, disgusted, disgusting), aversion, loathe (loathes, loathed, loathing), despise (despises, despised, despising), scorn (scorns, scorned, scorning), contempt, disdain (disdains, disdained, disdaining)
Проявлениями отрицательных эмоций также могут быть различные насмешки
mockery, ridicule, derision, sneer, scoff (scoffs, scoffed, scoffing), jeer, taunt (taunts, taunted, taunting)
Также проявлениями эмоций являются
laughter, laugh (laughs, laughed, laughing), grin (grins, grinned, grinning), chuckle (chuckles, chuckled, chuckling), giggle, (giggles, giggled, giggling), guffaw (guffaws, guffawed, guffawing - грубый хохот), snicker (snickers, snickered, snickering), smile (smiles, smiled, smiling), frown (frowns, frowned, frowning), cry (cries, cried, crying), tear (tears), sob (sobbs, sobbed, sobbing), weep (weeps, weeped, weeping), wail (wails, wailed, wailing), whimper (whimpers, whimpered, whimpering)

Добавляем в наш словарь - время

Ни в одной книге нельзя обойтись без различных указаний на время. так что добавляем в наш словарь:
time, future, day, week, month, year, age, century, centuries, today, tomorrow, tonight, yesterday, early, late, hour, minute, second, moment, morning, afternoon, noon, evening, night, monday, tuesday, wednesday, thursday, friday, saturday, sunday, january, february, march, april, may, june, july, august, september, october, novembar, december, now, when, then, old, older, new

среда, апреля 06, 2005

Немножко о словообразовании

Не забывайте, что одним из способов словообразования является переход слова из одной части речи в другую. Так что elbow - локоть, при этом to elbow somebody - толкать (пихать, подталкивать) кого-нибудь локтем
thumb - большой палец руки, to thumb - листать, перелистывать книгу (газету и т.п.)
shoulder - плечо, to shoulder - взваливать на плечи, нести на плечах (в прямом, а чаще в переносном смысле); проталкиваться плечом вперед (например, через толпу или открывать плечом дверь, когда руки заняты).

Человек - части тела

Основные части тела



1 - hair
2 - head
3 - eye
4 - ear
5 - nose
6 - lips
7 - face
8 - neck
9 - shoulder
10 - arm
11 - elbow
12 - wrist
13 - hand
14 - thumb
15 - fingers
16 - breast
17 - chest
18 - stomach/tum/tummy
19 - abdomen
20 - bottom
21 - thigh
22 - leg
23 - knee
24 - ankle
25 - foot/feet
26 - big toe
27 - toes



body, bodies
head, hair, face, forehead, eye, eyelash, eyebrow, ear, ear-lobe, nose, nostril, mouth, lip, tongue, tooth, teeth, neck, throat, chin, jaw, cheek, cheek-bone
shoulder, arm, elbow, wrist, hand, thumb, finger, fingernail, forearm (от локтя до запястья), fist
breast, chest, back, stomach (живот внутри), tum, tummy (живот снаружи; часто используют когда говорят о боли в животе), abdomen, bottom, buttocks ("пятая точка")
hip (бедро, тазобедренный сустав), thigh (бедро - часть ноги выше колена), leg, knee, ankle, foot, feet, toe, toes, shin (голень, нога ниже колена спереди), calf (икроножная мышца)
blood, bone, muscle, skin

Тема - люди

Романы населяет множество разных людей, связанных различными родственными и другими отношениями. Итак, приступим к составлению списка (если вы хотите добавить слова - пишите в комментарии). И не забывайте - вносите в список все формы слов, сохраняйте его как файл txt, каждое слово на отдельной строке.
people, person (когда надо сказать в ед. числе)
man, men, woman, women, child, children
Дети - boy, girl, kid, baby (обычно очень маленький ребенок, младенец), infant (младенец), toddler (маленький ребенок, обычно в возрасте, когда только начинает ходить), youngster (обычно мальчик-подросток), youth (юноша), offspring (отпрыск, потомок)
Родственники - family, parents, parent, grandparents, wife, wives, husband, mother, mama, mamma, mum, mommy, father, dad, daddy, son, daughter, brother, sister, grandmother, grandmamma, grandma, grandfather, grand-dad, grandad, grandpa, grandchild, granddaughter, grandson, cousin, aunt, uncle, nephew, grand-nephew, niece, grand-niece, sibling (брат или сестра), siblings (дети одних родителей), mate (один из пары), spouse (один из пары, муж/жена)
Приемные - adopt (усыновлять/удочерять), adoption (процесс),foster (принимать в семью без усыновления), stepbrother, stepsister (приемные/сводные), stepparent, stepmother, stepfather (мачеха/отчим), stepson, stepdaughter (пасынок/падчерица)
Свойственники (родственники по жене/мужу) - in-laws, brother-in-law, sister-in-law, father-in-law, mother-in-law, son-in-law, daughter-in-law
Другие отношения - friend, acquaintance (знакомый), neighbor, neighbour (сосед), flatmate, roommate (сосед по квартире/комнате)

Группы слов по темам

Один из способов пополнить свой словарный запас - создать списки слов по темам. Таким образом вы, во-первых, будете учить именно те слова, которые вам нужны. И во-вторых ассоциации с другими словами часто помогают лучше запомнить слова.
Мы хотим читать любовные романы, все равно, исторические или современные. Главное то, что это книги о людях и их отношениях. Так что нам не обойтись без слов, описывающих людей и их отношения и эмоции.

Составляем свой активный словарь

Сейчас, при наличии компьютеров и интернета процесс обучения стал намного проще. Помню, когда я только начинала читать первые книги на английском (на тот момент мой словарный запас был абсолютно минимальным) у меня вместо закладки была перфокарта, на которую я выписывала ключевые для понимания смысла слова, слова часто встречающиеся в тексте или понравившиеся мне выражения. Таким образом у меня постепенно получился свой мини-словарик. Постепенно смысл этих слов откладывался в памяти и читать становилось все легче. Но процесс этот был долгим и трудоемким.
Сейчас, при наличии книги в электронном варианте, можно заранее подготовиться, проверить свой словарный запас по отношению к "словарю" книги. Для этого предлагаю скачать маленькую программку (здесь). Это даже не одна, а две программы, плюс еще несколько полезных текстовых файлов. Эти программы помогают оценить словарный запас текста. Я не буду вдаваться в подробности, просто по ходу дела буду использовать возможности этих программ. Пример такого использования можно найти в предыдущем сообщении. Для того, чтобы начать ими пользоваться, их надо только разархивировать.

Итак, приступаем к составлению своего активного словаря. Для чего это нужно? Чтобы в дальнейшем не обращать на эти слова внимания.
Для начала давайте посмотрим файл function.txt. Это список основных "функциональных" слов (function words). Если честно, я не очень понимаю что означает этот термин, но в реальности это - артикли, предлоги, числительные, местоимения, модальные глаголы и некоторые прилагательные в различных формах. Всего 309 слов (каждая форма считается за отдельное слово).
Проверьте себя по этому списку. Я думаю, вы знаете практически все. У меня вызвали вопросы только albeit (хотя, поэтич.) и notwithstanding (несмотря на, вопреки).
Сохраните файл под другим именем, с расширением txt, удалив незнакомые вам слова. Это будет ваш активный словарь. Добавьте туда те слова, которые вам хорошо знакомы. Добавляйте все формы слова, одно слово на строчку. Например, я думаю ни у кого не вызывают вопросов такие слова как go, went, gone, going; или love, loved, loves, loving. Рекомендую к "инговой" форме добавлять еще форму без последнего "g", напр. goin, т.к. авторы часто используют эти формы в "разговорной речи" (goin', просто программа не читает последний апостроф).
Для составления своего активного словаря можно также использовать прилагаемые к программе текстовые файлы
basewrd1.txt - тысяча чаще всего употребляемых слов (включая все формы - более 4-х тысяч слов)
basewrd2.txt - вторая тысяча слов
basewrd3.txt - это слова, не входящие в первые два списка, но которые часто встречаются в учебных текстах на разные темы.

вторник, апреля 05, 2005

Начинаем читать на английском

Для того, чтобы начать читать любовные романы на английском, вовсе не обязательно очень хорошо знать язык. Конечно, основы знать необходимо, но все остальное приложится по ходу дела. Только не надо бояться, и не надо пытаться сразу замахнуться на нечто большое и сложное.
Грамматика - большинство авторов не используют сложных грамматических конструкций, так что здесь особых проблем возникнуть не должно.
Словарный запас.
Именно он, а вернее его отсутствие, представляет проблему для большинства. Но и здесь не стоит особенно пугаться. Сначала главное - научиться понимать, что же происходит в книге. Если вы не уловите оттенков эмоций, это не страшно. А всякие красивости и вообще можно пропускать. Давным давно я случайно открыла в магазине книгу, нечто вроде методического пособия для изучения иностранного языка. Так вот, мне сразу в глаза бросилась фраза, которая звучала примерно следующим образом: "Не стремитесь сразу понять все детали. В конце концов, если вы поняли, что шериф прятался за кустом, то не все ли вам равно, за каким именно кустом он прятался." Отсюда вывод - ни в коем случае не хватайтесь за словарь, встретив первое же непонятное слово. Лезьте в словарь, только если слово встречается регулярно, или если вы начинаете терять нить происходящего.

Для начала предлагаю попробовать почитать совсем маленькую книжку Сандры Мартон - Runaway Mistress (скачать). Это рассказ (из тех, что публикуются на сайте eharlequin.com). Она меньше по объему и проще, чем даже обычные "арлекинки" (которые у нас выпускает "Радуга"). Но этот рассказ входит в серию про Баронов, книги из которой у нас переводились (смотри здесь).

Но для начала - немного статистики (файл со статистикой, в том числе всеми встречающимися в книге словами, можно скачать здесь).
Я прогнала файл через программку, которая считает частоту употребления слов, и немного обработала результаты. Что получилось?
Всего в файле 12727 слов (без имен собств. и различных сокращений, типа 'll).
Артикли и местоимения - 3245 (25% от общего кол-ва слов).
Т.е. на все остальное приходится ~ 9400 слов. Из них:
21% приходится на такие общеизвестные слова, как
TO, AND, IS, ISN’t, WAS, WASN’t, HAVE, HAVEN’t HAD, HADN’t, HAS, HASN’t, HAVING
THAT, OF, DO, DID, DIDN't, DOES, DOESN't, DOING, DON't, DONE, IN, SAY, SAID, SAYING, SAYS, BE, BEEN, BEING
Еще 25% приходится на слова
AS, BUT, WITH, NOT, WHAT, ON, FOR, WANT, WANTED, KNOW, KNEW, KNOWING, KNOWN, FROM
THINK, THINKING, THINKS, THOUGHT, THOUGHTS, WOULD, WOULDN't, THIS, AT, SO, ARM, ARMS, INTO, LOVE, LOVED, LOVER, COULD, COULDN't, NO, IF, OUT, EYE, EYES, EYEBROW, EYEBROWS, FEEL, FEELING, FELT, LOOK, LOOKED, LOOKIN, LOOKING, LOOKS, TAKE, TAKEN, TAKES, TAKING, TOOK, GO, GOING, GONE, SEE, SAW, SEEING, SEEN, ALL, BACK, HAND, HANDS, THEN, JUST, KISS, KISSED, KISSES, KISSING, WHO, WHOM, WHOSE, YES, WHEN, ARE, AREN'T, WERE, WOMAN, WOMEN, HORSE, HORSES, MAN, MEN, FACE, HOW, LIKE, LIKED, UP, WILL, ABOUT, DOWN

Надеюсь, вам все эти слова знакомы? Значит, спокойно беритесь за чтение.