В определенных ситуациях описание extern может быть опущено: если внешнее определение переменной находится в том же исходном файле, раньше ее использования в некоторой конкретной функции, то не обязательно включать описание extern для этой переменной в саму функцию. Описания extern в функциях main, getline и copy являются, таким образом, излишними.
Фактически, обычная практика заключается в помещении определений всех внешних переменных в начале исходного файла и последующем опускании всех описаний extern.
Если программа находится в нескольких исходных файлах, и некоторая переменная определена, скажем в файле 1, а используется в файле 2, то чтобы связать эти два вхождения переменной, необходимо в файле 2 использовать описание extern. Этот вопрос будет обсуждаться в главе 5.
Вы должно быть заметили, что мы в этом разделе при ссылке на внешние переменные очень аккуратно используем слова описание и определение. «Определение» относится к тому месту, где переменная фактически заводится и ей выделяется память; «описание» относится к тем местам, где указывается природа переменной, но никакой памяти не отводится.
Между прочим, существует тенденция объявлять все, что ни попадется, внешними переменными, поскольку кажется, что это упрощает связи, – списки аргументов становятся короче и переменные всегда присутствуют, когда бы вам они ни понадобились. Но внешние переменные присутствуют и тогда, когда вы в них не нуждаетесь. Такой стиль программирования чреват опасностью, так как он приводит к программам, связи данных внутри которых не вполне очевидны. Переменные при этом могут изменяться неожиданным и даже неумышленным образом, а программы становится трудно модифицировать, когда возникает такая необходимость. Вторая версия программы поиска самой длинной строки уступает первой отчасти по этим причинам, а отчасти потому, что она лишила универсальности две весьма полезные функции, введя в них имена переменных, с которыми они будут манипулировать.
Упражнение 2-18. Проверка в операторе for функции getline довольно неуклюжа. Перепишите программу таким образом, чтобы сделать эту проверку более ясной, но сохраните при этом то же самое поведение в конце файла и при переполнении буфера. Является ли это поведение самым разумным?
2.11. Некоторые оптимистичные выводы
На данном этапе мы обсудили то, что можно бы назвать традиционным ядром языка «C». Имея эту горсть строительных блоков, можно писать полезные программы весьма значительного размера, и было бы вероятно неплохой идеей, если бы вы задержались здесь на какое-то время и поступили таким образом: следующие ниже упражнения предлагают вам ряд программ несколько большей сложности, чем те, которые были приведены в этой главе.
После того, как вы овладеете этой частью «C», приступайте к чтению следующих нескольких глав. Усилия, которые вы при этом затратите, полностью окупятся, потому что в этих главах обсуждаются именно те стороны «C», где мощь и выразительность языка начинает становиться очевидной.
Упражнение 2-19. Напишите программу detab, которая заменяет табуляции во вводе на нужное число пробелов так, чтобы промежуток достигал следующей табуляционной остановки. Предположите фиксированный набор табуляционных остановок, например, через каждые n позиций.
Упражнение 2-20. Напишите программу entab, которая заменяет строки пробелов минимальным числом табуляций и пробелов, достигая при этом тех же самых промежутков. Используйте те же табуляционные остановки, как и в detab.
Упражнение 2-21. Напишите программу для «сгибания» длинных вводимых строк после последнего отличного от пробела символа, стоящего до столбца n ввода, где n – параметр. Убедитесь, что ваша программа делает что-то разумное с очень длинными строками и в случае, когда перед указанным столбцом нет ни табуляций, ни пробелов.
Упражнение 2-22. Напишите программу удаления из «C»-программы всех комментариев. Не забывайте аккуратно обращаться с «закавыченными» строками и символьными константами.
Упражнение 2-23. Напишите программу проверки «C»-программы на элементарные синтаксические ошибки, такие как несоответствие круглых, квадратных и фигурных скобок. Не забудьте о кавычках, как одиночных, так и двойных, и о комментариях. – Эта программа весьма сложна, если вы будете писать ее для самого общего случая.
Переменные и константы являются основными объектами, с которыми оперирует программа. Описания перечисляют переменные, которые будут использоваться, указывают их тип и, возможно, их начальные значения. Операции определяют, что с ними будет сделано. Выражения объединяют переменные и константы для получения новых значений. Все это – темы настоящей главы.
Хотя мы этого сразу прямо не сказали, существуют некоторые ограничения на имена переменных и символических констант. Имена составляются из букв и цифр; первый символ должен быть буквой. Подчеркивание "_" тоже считается буквой; оно полезно для удобочитаемости длинных имен переменных. Прописные и строчные буквы различаются; традиционная практика в «С» – использовать строчные буквы для имен переменных, а прописные – для символических констант.
Играют роль только первые восемь символов внутреннего имени, хотя использовать можно и больше. Для внешних имен, таких как имена функций и внешних переменных, это число может оказаться меньше восьми, так как внешние имена используются различными ассемблерами и загрузчиками. Детали приводятся в Приложении. Кроме того, такие ключевые слова как if, else, int, float и т.д., зарезервированы: вы не можете использовать их в качестве имен переменных. (Они пишутся строчными буквами).
Конечно, разумно выбирать имена переменных таким образом, чтобы они означали нечто, относящееся к назначению переменных, и чтобы было менее вероятно спутать их при написании.
Языке «C» имеется только несколько основных типов данных:
· char один байт, в котором может находиться один символ из внутреннего набора символов;
· int – целое, обычно соответствующее естественному размеру целых в используемой машине;
· float – с плавающей точкой одинарной точности;
· double – с плавающей точкой двойной точности.
Кроме того имеется ряд квалификаторов, которые можно использовать с типом int: short (короткое), long (длинное) и unsigned (целое без знака). Квалификаторы short и long указывают на различные размеры целых. Числа без знака подчиняются законам арифметики по модулю 2 в степени n, где n – число битов в int; числа без знаков всегда положительны. Описания с квалификаторами имеют вид:
short int x;
long int y;
unsigned int z;
Cлово int в таких ситуациях может быть опущено, что обычно и делается.
Количество битов, отводимых под эти объекты зависит от имеющейся машины. Ниже в таблице 3.1. приведены некоторые характерные значения.
Таблица 3.1.
Размеры объектов данных (бит)
Объекты данных | HONEYWELL | IBM | INTERDATA | INTEL Pentium-IV |
char | 8-бит | 9-бит | 8-бит | 8-бит |
int | 16 | 36 | 32 | 32 |
short | 16 | 36 | 16 | 16 |
long | 32 | 36 | 32 | 32 |
float | 32 | 36 | 32 | 32 |
double | 64 | 72 | 64 | 64 |
Цель состоит в том, чтобы short и long давали возможность в зависимости от практических нужд использовать различные длины целых; тип int отражает наиболее «естественный» размер разрядной сетки конкретной машины. Как вы видите, каждый компилятор свободно интерпретирует short и long в соответствии со своими аппаратными средствами. Все, на что вы можете твердо полагаться, это то, что short не длиннее, чем long.
Константы типа int и float мы уже рассмотрели. Отметим еще только, что как обычная 123.456е–7, так и «научная» запись 0.12е3 для float является законной.
Каждая константа с плавающей точкой считается имеющей тип double, так что обозначение «е» служит как для float, так и для double.
Длинные константы записываются в виде 123l (от англ. long). Обычная целая константа, которая слишком длинна для типа int, рассматривается как long.
Существует система обозначений для восьмеричных и шестнадцатеричных констант: лидирующий 0 (нуль) в константе типа int указывает на восьмеричную константу, а стоящие впереди 0x соответствуют шестнадцатеричной константе. Например, десятичное число 31 можно записать как 037 в восьмеричной форме и как 0x1f в шестнадцатеричной. Шестнадцатеричные и восьмеричные константы могут также заканчиваться буквой l, что делает их относящимися к типу long.
3.3.1. Символьная константа. Символьная константа – это один символ, заключенный в одинарные кавычки, как, например, 'х'. Значением символьной константы является численное значение этого символа во внутреннем машинном наборе символов. Например, в наборе символов ASCII символьный нуль, или '0', имеет значение 48, а в коде EBCDIC – 240, и оба эти значения совершенно отличны от числа 0. Написание '0' вместо численного значения, такого как 48 или 240, делает программу не зависящей от конкретного численного представления этого символа в данной машине. Символьные константы точно так же участвуют в численных операциях, как и любые другие числа, хотя наиболее часто они используются в сравнении с другими символами. Правила преобразования будут изложены позднее.