C-строки

Материал из Вики ИТ мехмата ЮФУ
Перейти к: навигация, поиск

Определение. C-строкой называется массив char, содержащий символ с нулевым кодом (байт, у которого все биты равны 0), этот символ традиционно используется как маркер конца строки.

Сам нулевой байт не считается частью строки (например, длина C-строки, представленной массивом, у которого первый же байт нулевой, считается равной нулю). Из-за того, что длина C-строки изначально неизвестна, обработка строк обычно отличается от работы с обычными массивами через индексы. А именно, здесь используются указатели:

for (char * p = str; *p != 0; ++p) { /* ... */ }
while (*p++) { /* ... */ }

Примеры

// Вычисление длины строки
int string_length(char * s) {
    int len = 0;

    // Цикл закончится при достижении нулевого байта, обозначающего конец строки
    for ( ; *s != 0; ++s)
        ++len;
    
    return len;
}

// Каждая латинская буква, кроме 'z', меняется на следующую в алфавите
void shift_string(char * s)  {
    for ( ; *s; ++s) {             // Ненулевое значение кода символа преобразуется к True
                                   // Этот заголовок цикла работает также, как в string_length
        if ('a' <= *s && *s < 'z')
            ++(*s);                // Увеличение кода символа на единицу
    }
}

Третий, довольно распространённый вариант цикла по всей строке выглядит так:

while (*s) {
    // работа с очередным символом строки: *s и в какой-то момент увеличение адреса: ++s / s++
    // часто бывает совмещено: *s++ / *++s
}

Ввиду того, что увеличение адреса может выполняться где-угодно в теле цикла (в отличие от for, в котором оно обычно выполняется в заголовке), такой цикл может быть более труден для понимания и поиска в нём ошибок. Однако если тело цикла не велико (одна-две строчки), то в большинстве случаев опытный C-программист выберет именно while.

Запись значений C-строк

C-строки можно вводить с клавиатуры, заботясь о том, чтобы памяти соответствующего массива было достаточно для хранения введённой строки вместе с нулевым байтом. Кроме того, C-строки можно инициализировать строковыми литералами (последовательность символов, заключённая в двойные кавычки):

const char * s = "Hello, world"; // (1) указатель на константу типа char, то есть мы не можем менять строку
char s[] = "Goodbye, world";     // (2) можем менять строку

В обоих случаях вы получаете корректную C-строку, то есть массив символов, заканчивающихся нулевым байтом, однако в первом случае — массив константный, во втором — изменяемый.

Если C-строке не было задано значение при объявлении, строковый литерал в неё можно запись с помощью стандартной функции strcpy:

strcpy(s, "Hello, world") // s должен указывать на массив достаточной длины

Печать C-строк осуществляется, как обычно, с помощью cout.

cout << s << endl;