Навигация по сайту

Популярные книги

Измена. От меня не уйдешь, девочка! (СИ) - Алиса Лиман

Запрещаю тебе уходить - Алиса Ковалевская

Измена. Не прощу (СИ) - Леманн Анастасия

Рейтинговые книги

4.4

3.7

Просто секс и ничего личного - Стася Андриевская

Книга онлайн » Компьютеры и Интернет » Программирование » C++. Сборник рецептов - Д. Стефенс

Читем онлайн C++. Сборник рецептов - Д. Стефенс

Шрифт:

Интервал:

Закладка:

Сделать

<< На первую страницу

1 ... 39 40 41 42 43 44 45 46 47 ... 136

Разделение строки, использующей единственный символ-разделитель, является очень распространенной задачей, и неудивительно, что ее решение есть в библиотеке Boost String Algorithms. Оно просто в использовании. Чтобы увидеть, как разделить строку с помощью функции split из Boost, посмотрите на пример 4.11.

Пример 4.11. Разделение строки с помощью Boost

#include <iostream>

#include <string>

#include <list>

#include <boost/algorithm/string.hpp>

using namespace std;

using namespace boost;

int main() {

string s = "one,two,three,four";

list<string> results;

split(results, s, is_any_of(",")); // Обратите внимание - это boost::split

for (list<string>::const_iterator p = results.begin();

p != results.end(); ++p) {

cout << *p << endl;

}

split — это шаблон функции, принимающий три аргумента. Он объявлен вот так.

template<typename Seq, typename Coll, typename Pred>

Seq& split(Seq& s, Coll& c, Pred p,

token_compress_mode_type e = token_compress_off);

Seq, Coll и Pred представляют типы результирующей последовательности, входной коллекции и предиката, используемого для определения, является ли очередной объект разделителем. Аргумент последовательности — это последовательность, определенная по стандарту C++, содержащая нечто, что может хранить части того, что находится во входной коллекции. Так, например, в примере 4.11 был использован list<string>, но вместо него можно было бы использовать и vector<string>. Аргумент коллекции — это тип входной последовательности. Коллекция — это нестандартная концепция, которая похожа на последовательность, но с несколько меньшими требованиями (за подробностями обратитесь к документации по Boost по адресу www.boost.org). Аргумент предиката — это объект унарной функции или указатель на функцию, которая возвращает bool, указывающий, является ли ее аргумент разделителем или нет. Она вызывается для каждого элемента последовательности в виде f(*it), где it — это итератор, указывающий на элемент последовательности.

is_any_of — это удобный шаблон функции, поставляющийся в составе String Algorithms, которая облегчает жизнь при использовании нескольких разделителей. Он конструирует объект унарной функции, которая возвращает true, если переданный ей аргумент является членом набора. Другими словами:

bool b = is_any_of("abc")('a'); // b = true

Это облегчает проверку нескольких разделителей, не требуя самостоятельного написания объекта функции.

4.7. Разбиение строки на лексемы

Проблема

Требуется разбить строку на части, используя набор разделителей.

Решение

Для перебора элементов строки и поиска места нахождения следующих лексем и не-лексем используйте методы find_first_of и first_first_not_of. Пример 4.12 представляет простой класс StringTokenizer, выполняющий эту задачу.

Пример 4.12. Разбиение строки на лексемы

#include <string>

#include <iostream>

using namespace std;

// Класс, разбивающий строку на лексемы.

class StringTokenizer {

public:

StringTokenizer(const string& s, const char* delim = NULL) :

str_(s), count(-1), begin_(0), end_(0) {

if (!delim)

delim_ = " fnrtv"; //по умолчанию пробельные символы

else

delim_ = delim;

// Указывает на первую лексему

begin_ = str_.find_first_not_of(delim);

end_ = str.find_first_of(delim_, begin_);

}

size_t countTokens() {

if (count_ >= 0) // если уже посчитали, то выход

return(count_);

string::size_type n = 0;

string::size_type i = 0;

for (;;) {

// переход на первую лексему

if ((i = str_.find_first_not_of(delim_, i)) == string::npos)

break;

// переход на следующий разделитель

i = str_.find_first_of(delim_, i+1);

n++;

if (i == string::npos) break;

}

return (count_ = n);

}

bool hasMoreTokens() { return(begin_ != end_); }

void nextToken(string& s) {

if (begin_ != string::npos && end_ != string::npos) {

s = str_.substr(begin_, end_-begin_);

begin_ = str_.find_first_not_of(delim_, end_);

end_ = str_.find_first_of(delim_, begin_);

} else if (begin_ != string::npos && end_ == string::npos) {

s = str_.substr(begin_, str_.length()-begin_);

begin_ = str_.find_first_not_of(delim_, end_);

}

private:

StringTokenizer() {}

string delim_;

string str_;

int count_;

int begin_;

int end_;

};

int main() {

string s = " razzle dazzle giddyup ";

string tmp;

StringTokenizer st(s);

cout << "Здесь содержится" << st.countTokens() << " лексемы.n";

while (st.hasMoreTokens()) {

st.nextToken(tmp);

cout << "token = " << trap << 'n';

}

Обсуждение

Разбиение строки с четко определенной структурой, как в примере 4.10, конечно, хорошо, но не все так просто. Предположим, что, вместо того чтобы просто разделить строку на основе единственного разделителя, требуется разбить строку на лексемы. Наиболее частым вариантом этой задачи является разделение на лексемы с игнорированием пробелов. Пример 4.12 дает реализацию класса StringTokenizer (аналогичного стандартному классу Java™ с таким же именем) для C++, который принимает символы-разделители, но по умолчанию использует пробелы.

Наиболее важные строки в StringTokenizer используют методы find_first_of и find_first_not_of шаблона класса basic_string. Их описание и примеры использования даны в рецепте 4.9. Пример 4.12 дает такой вывод.

Здесь содержится 3 лексемы.

token = razzle

token = dazzle

token = giddyup

StringTokenizer — это более гибкая форма функции split из примера 4.10. Он поддерживает свое состояние, так что можно просто последовательно переходить с одной лексемы на другую, не разбивая вначале всю строку на части. Также есть возможность подсчитать число лексем.

В StringTokenizer можно внести пару усовершенствований. Во-первых, для простоты StringTokenizer написан так, что он работает только с простыми строками — другими словами, строками из узких символов. Если требуется, чтобы один и тот же класс работал как с узкими, так и с широкими символами, параметризуйте тип символов, как это сделано в предыдущих рецептах. Другим улучшением является расширение StringTokenizer так, чтобы он обеспечивал более дружественное взаимодействие с последовательностями и был более гибок. Вы всегда можете сделать это сами, а можете использовать имеющийся класс разбиения на лексемы. Проект Boost содержит класс tokenizer, делающий все это. За подробностями обратитесь к www.boost.org.

Смотри также

Рецепт 4.24.

4.8. Объединение нескольких строк

Проблема

Имея последовательность строк, такую как вывод примера 4.10, вам требуется объединить их в одну длинную строку, возможно, с разделителями.

Решение

В цикле переберите всю последовательность строк и добавьте каждую из них в выходную строку. В качестве входа можно обрабатывать любую стандартную последовательность. Пример 4.13 использует vector из элементов типа string.

Пример 4.13. Объединение последовательности строк

#include <string>

#include <vector>

#include <iostream>

using namespace std;

void join(const vector<string>& v, char c, string& s) {

s.clear();

for (vector<string>::const_iterator p = v.begin();

p ! = v.end(); ++p) {

s += *p;

if (p != v.end() - 1) s += c;

}

int main() {

vector<string> v;

vector<string> v2;

string s;

v.push_back(string("fее"));

v.push_back(string("fi"));

v.push_back(string("foe"));

v.push_back(string("fum"));

join(v, '/', s);

cout << s << 'n';

}

Обсуждение

Пример 4.13 содержит одну методику, которая несколько отличается от предыдущие примеров. Посмотрите на эту строку.

for (vector<string>::const_iterator p = v.begin();

Предыдущие примеры работы со строками использовали iterator'ы без части «const», но здесь без этого не обойтись, так как v объявлен как ссылка на объект const. Если имеется объект контейнера const, то для доступа к его элементам можно использовать только const_iterator. Это так потому, что простой iterator позволяет записывать в объект, на который он указывает, что, конечно, нельзя делать в случае с объектами контейнера типа const.

1 ... 39 40 41 42 43 44 45 46 47 ... 136

На этой странице вы можете бесплатно читать книгу C++. Сборник рецептов - Д. Стефенс бесплатно.

Похожие на C++. Сборник рецептов - Д. Стефенс книги

ЯЗЫК ПРОГРАММИРОВАНИЯ С# 2005 И ПЛАТФОРМА .NET 2.0. 3-е издание - Эндрю Троелсен - Программирование
Эффективное использование STL - Скотт Мейерс - Программирование
Платформа J2Me - Автор неизвестен - Программирование
97 этюдов для архитекторов программных систем - Нил Форд - Программирование
Мама, я тимлид! Практические советы по руководству IT-командой - Марина Перескокова - Программирование
Программирование на Visual C++. Архив рассылки - Алекс Jenter - Программирование
Сделай видеоигру один и не свихнись - Слава Грис - Программирование / Руководства
Разберись в Data Science. Как освоить науку о данных и научиться думать как эксперт - Алекс Дж. Гатман - Программирование
Устойчивый веб-дизайн - Jeremy Keith - Прочая околокомпьтерная литература / Интернет / Программирование

Оставить комментарий