строка, струна, ряд, шнурок, струнный, нанизывать, натягивать
существительное ↓
- верёвка, бечёвка
a ball [a piece] of string — клубок [кусок] верёвки /бечёвки/
- тесёмка, завязка, шнурок
- струна
string band /orchestra/ — струнный оркестр
string quartet — струнный квартет
string tuner — машинка для настройки струн (скрипки и т. п.)
the highest string of violin — квинта
to touch the strings — ударить по струнам; играть на струнном инструменте
to pluck the strings of a guitar — наигрывать на гитаре
- pl. струнные инструменты оркестра
- pl. музыканты, играющие на струнных инструментах
ещё 22 варианта
глагол ↓
- снабжать струной, тетивой
- натягивать (струну, тетиву и т. п.)
- настраивать (музыкальный инструмент)
- напрягать (тж. string up)
to be strung for a fight — напрячь силы для боя
- завязывать, привязывать; шнуровать
ещё 11 вариантов
Мои примеры
Словосочетания
cutting a piece of string — отрезая кусок верёвки
to lay / string cable — протягивать кабель
string concatenation — конкатенация строк, сцепление строк (символов)
string cornice — поясок
dead-end insulator string — натяжная гирлянда изоляторов
string orchestra — струнный оркестр
to string a racket — перетягивать ракетку
apron string — завязки на фартуке
small children’s air-balloons attached to string — детские воздушные шарики на верёвочке
string of facts — ряд фактов
string of cars — вереница автомобилей
Примеры с переводом
She tied a string around the boxes.
Она обвязала коробки бечёвкой.
Her key hung on a string around her neck.
Её ключ висел на шнурке у неё на шее.
This string is all in a tangle.
Эта верёвка вся перепуталась.
Susie has her mother on a string.
Сьюзи вертела своей матерью, как хотела. / Сьюзи вила из своей матери верёвки.
The pile of newspapers was bound with string.
Стопка газет была обвязана бечёвкой.
They strung wires from tree to tree.
Они натянули между деревьями провода.
We strung popcorn garlands for the Christmas tree.
Мы сделали из попкорна гирлянды на ёлку.
ещё 23 примера свернуть
Примеры, ожидающие перевода
He twanged the guitar string
Don’t untune that string!
She wore a string of pearls.
Для того чтобы добавить вариант перевода, кликните по иконке ☰, напротив примера.
Фразовые глаголы
string along — быть преданным, следовать за, обманывать, водить за нос, идти, ехать с
string out — растягиваться, растянуть, затянуть, быть под действием наркотика
string up — вешать, вздернуть, напрягать, взвинчивать
Возможные однокоренные слова
stringed — струнный, перевязанный бечевкой
stringency — строгость, точность, стесненность, убедительность, вескость, недостаток денег
stringent — строгий, точный, обязательный, веский, убедительный
stringer — стрингер, тетива, продольная балка, тетива лестницы
stringy — волокнистый, тягучий, вязкий
unstring — распускать, расшатывать, снять или ослабить струны
stringiness — волокнистость, тягучесть
restring — перетянуть, струны, нанизать, перенизать
stringing — укладка, подвеска, набор струн, аккорд
Формы слова
verb
I/you/we/they: string
he/she/it: strings
ing ф. (present participle): stringing
2-я ф. (past tense): strung
3-я ф. (past participle): strung
noun
ед. ч.(singular): string
мн. ч.(plural): strings
I wanted to know how to iterate through a string word by word.
string = "this is a string"
for word in string:
print (word)
The above gives an output:
t
h
i
s
i
s
a
s
t
r
i
n
g
But I am looking for the following output:
this
is
a
string
Pavel
5,0804 gold badges29 silver badges53 bronze badges
asked Aug 6, 2015 at 1:41
1
When you do —
for word in string:
You are not iterating through the words in the string, you are iterating through the characters in the string. To iterate through the words, you would first need to split the string into words , using str.split()
, and then iterate through that . Example —
my_string = "this is a string"
for word in my_string.split():
print (word)
Please note, str.split()
, without passing any arguments splits by all whitespaces (space, multiple spaces, tab, newlines, etc).
Olivier Pons
15.3k26 gold badges118 silver badges211 bronze badges
answered Aug 6, 2015 at 1:43
Anand S KumarAnand S Kumar
87.3k18 gold badges183 silver badges172 bronze badges
2
This is one way to do it:
string = "this is a string"
ssplit = string.split()
for word in ssplit:
print (word)
Output:
this
is
a
string
answered Aug 6, 2015 at 1:45
Joe T. BokaJoe T. Boka
6,5046 gold badges27 silver badges48 bronze badges
for word in string.split():
print word
answered Aug 6, 2015 at 1:50
ConnorConnor
1346 bronze badges
2
Using nltk.
from nltk.tokenize import sent_tokenize, word_tokenize
sentences = sent_tokenize("This is a string.")
words_in_each_sentence = word_tokenize(sentences)
You may use TweetTokenizer for parsing casual text with emoticons and such.
answered Oct 16, 2019 at 21:24
noɥʇʎԀʎzɐɹƆnoɥʇʎԀʎzɐɹƆ
9,6992 gold badges47 silver badges65 bronze badges
One way to do this is using a dictionary. The problem for the code above is it counts each letter in a string, instead of each word. To solve this problem, you should first turn the string into a list by using the split() method, and then create a variable counts each comma in the list as its own value. The code below returns each time a word appears in a string in the form of a dictionary.
s = input('Enter a string to see if strings are repeated: ')
d = dict()
p = s.split()
word = ','
for word in p:
if word not in d:
d[word] = 1
else:
d[word] += 1
print (d)
answered Nov 17, 2021 at 2:55
s = 'hi how are you'
l = list(map(lambda x: x,s.split()))
print(l)
Output: ['hi', 'how', 'are', 'you']
answered Dec 11, 2019 at 15:56
Nanda ThotaNanda Thota
3023 silver badges10 bronze badges
You can try this method also:
sentence_1 = «This is a string»
list = sentence_1.split()
for i in list:
print (i)
answered Aug 9, 2022 at 9:31
2
Asked by: Vallie Herzog DVM
Score: 4.9/5
(34 votes)
A stringy sentence is made up of several complete thoughts. strung together with words like and or but. Stringy sentences just. ramble on and on. They don’t give the reader a chance to pause.
What is a stringy sentence examples?
Stringy sentences are so long that the reader forgets the beginning of the sentence before reaching the end. Look at the examples below. Stringy: My best friend’s name is Vutha and he lives next door and so we do many things together. … Revised: My best friend’s name is Vutha, and he lives next door.
What is stringy in writing?
A stringy sentence is a sentence that is usually difficult to read and understand because it has too many clauses, often due to an overuse of coordinating and/or subordinating conjunctions.
Is a fragment sentence?
Fragments are incomplete sentences. Usually, fragments are pieces of sentences that have become disconnected from the main clause. One of the easiest ways to correct them is to remove the period between the fragment and the main clause.
What is choppy sentence?
Problem. Too many short simple sentences can make your writing appear unsophisticated and your ideas seem disconnected. This impression can also be caused by too many sentences in a row that begin with a simple subject.
20 related questions found
How do you fix a stringy sentence?
Revising Stringy Sentences
First, identify the stringy sentences. Then, revise them by (1) breaking each sentence into two or more sentences or (2) turning some of the complete thoughts into phrases or sub- ordinate clauses. If the sentence is effective and does not need to be improved, write C for correct.
How do you get rid of choppy sentences?
If you find that you have a lot of short, choppy sentences in your writing, here are five ways to improve them.
- Conjunctions. Try combining sentences using a conjunction. …
- Subordination. Subordination involves combining a main idea with an incomplete clause using a connector. …
- Appositives. …
- Modifying Phrases. …
- Reworked Ideas.
How do you tell if it is a sentence fragment?
When the full thought is not expressed because either the subject or the verb is missing, you have a sentence fragment. The problem with fragments is that they don’t tell the whole story. Key elements are missing, leaving the reader hanging without a sense of the full thought.
What is a example sentence?
[M] [T] I don’t care what she eats. [M] [T] I don’t know what you mean. [M] [T] She didn’t know what to do. [M] [T] Tom has no idea what to do.
What’s a fragment sentence?
A sentence fragment is a word, phrase, or dependent clause that is punctuated as a sentence, but the subject, verb, or both may be missing. A sentence fragment is a sentence that’s missing some key piece to complete it grammatically.
What is a wordy sentence?
Wordy sentences use too many useless words that clutter writing. Good writing is simple and direct; it uses the simplest word possible that conveys the same meaning. Wordiness takes away from this clarity. … If you can remove a word while keeping the sentence’s meaning, the sentence is wordy.
What makes a comma splice?
A comma splice occurs when you use a comma to join two complete sentences without placing an appropriate joining word between them. The comma just isn’t strong enough to do the job of making one grammatical sentence out of two.
What are compound sentences?
A compound sentence is made up of two independent clauses joined by a coordinating conjunction (for, and, nor, but, or, yet, or so) and a comma or by a semicolon alone. Example: The pirate captain lost her treasure map, but she still found the buried treasure.
What are complex sentences?
A complex sentence is formed by adding one or more subordinate (dependent) clauses to the main (independent) clause using conjunctions and/or relative pronouns. A clause is a simple sentence. Simple sentences contain only one clause (verb group). Complex sentences contain more than one clause (verb group).
What does lack of parallelism mean?
Parallelism refers to the principle that parts of a sentence that are the same in function should be the same in structure. Words or phrases joined by coordinating conjunctions should have the same form.
What is sentence and give 5 examples?
Simple Sentences
The train was late. Mary and Samantha took the bus. I looked for Mary and Samantha at the bus station. Mary and Samantha arrived at the bus station early but waited until noon for the bus.
What are three sentences?
Three essential types of sentence are declarative sentences (which are statements), interrogative sentences (which are questions), and imperative sentences (which are orders).
What are the five sentences?
A five sentence paragraph consists of a main idea sentence, three sentences that explain the main idea with reasons, details or facts and a concluding sentence.
How do you know if its a complete sentence?
Sentences always begin with a capital letter and end in either a full stop, exclamation or question mark. A complete sentence always contains a verb, expresses a complete idea and makes sense standing alone. Andy reads quickly.
What is a clause in a sentence?
1 : a group of words containing a subject and predicate and functioning as a member of a complex (see complex entry 2 sense 1b(2)) or compound (see compound entry 2 sense 3b) sentence The sentence «When it rained they went inside» consists of two clauses: «when it rained» and «they went inside.»
What are the four types of fragments?
A fragment is a group of words that is less than a sentence. To help identify fragments, they are grouped into four categories: —ing fragments, appositive fragments, infinitive fragments, and conjunction fragments.
How do you fix clunky writing?
6 Tips to Avoid and Fix Bad Writing
- Read Out Loud. This is the first step to checking your piece for awkward writing: read it out loud. …
- Shorten Your Sentences. One of the best ways to avoid awkward writing is to take out every unnecessary word, phrase, and sentence. …
- Be Specific. …
- Re-Word. …
- Tighten. …
- Delete.
Why Simple sentences are bad?
Small sentences are boring to read and, in fact, many of them strung together look bad because they appear simple. If your thoughts look simple, it will seem like you can’t sustain an idea for more than a few words and can think in only trivial, simplistic ways.
What are examples of conjunctions?
Examples of Conjunctions
- I tried to hit the nail but hit my thumb instead.
- I have two goldfish and a cat.
- I’d like a bike for commuting to work.
- You can have peach ice cream or a brownie sundae.
- Neither the black dress northe gray one looks right on me.
- My dad always worked hard so we could afford the things we wanted.
Given a Sentence, write a Python program to convert the given sentence into a list of words.
Examples:
Input : 'Hello World' Output : ['Hello', 'world']
Method 1: Split a sentence into a list using split()
The simplest approach provided by Python to convert the given list of Sentences into words with separate indices is to use split() method. This method split a string into a list where each word is a list item. We have alternative ways to use this function in order to achieve the required output.
Python3
lst
=
"Geeks For geeks"
print
( lst.split())
Output:
['Geeks', 'For', 'geeks']
Method 2: Split a sentence into a list using for loop
We can also use a Python for loop to split the first element. This method is also beneficial if we have more than one element.
Python3
def
convert(lst):
return
([i
for
i
in
lst.split()])
lst
=
'Geeksforgeeks is a portal for geeks'
print
( convert(lst))
Output:
['Geeksforgeeks', 'is', 'a', 'portal', 'for', 'geeks']
Method 3: Split a sentence into a list using join()
We can split the given list and then join using join() function. We can also use this when you have a list of strings or a single string inside a list.
Python3
def
convert(lst):
return
''.join(lst).split()
lst
=
'Hello Geeks for geeks'
print
( convert(lst))
Output:
['Hello', 'Geeks', 'for', 'geeks']
Method 4: Split a sentence into a list using nltk
For our particular issue, the nltk library’s word tokenize() method can be used. This function divides a string into several substrings by taking a string as an input parameter.
Python3
import
nltk
nltk.download(
'punkt'
)
string
=
"This is a sentence"
lst
=
nltk.word_tokenize(string)
print
(lst)
Output:
['This', 'is', 'geeksforgeeks']
Method 5: Using re
Approach is using regular expressions to split the sentence into a list of words. Here is an example of how this could be done using the re module:
Python3
import
re
def
split_sentence(sentence):
return
re.findall(r
'bw+b'
, sentence)
sentence
=
'Hello Geeks for geeks'
print
(split_sentence(sentence))
Output
['Hello', 'Geeks', 'for', 'geeks']
This approach uses a regular expression to match any sequence of word characters (letters and digits) surrounded by word boundaries (non-word characters or the start/end of the string). The findall function returns a list of all the matches in the string. This can be a useful method if you need to split the sentence into words while ignoring punctuation or other non-word characters.
The time complexity of the split_sentence function is O(n), where n is the length of the input string. This is because the findall function performs a linear scan of the input string to find all the matches.
The space complexity of the split_sentence function is also O(n), n is the number of words in the input string.
Содержание
- Объединение (concatenation) строк
- Сравнение строк
- Поиск в строке и перечисление
- Строковые операции
- Конструирование строк
- null и пустые строки
- Методы манипулирования строками
- Объединение и разбиение строк
- Сравнение строк
- StringBuilder
- Кодировка
- Форматирование и разбор (Formatting and Parsing)
- Методы ToString и Parse
- Интерфейс IFormattable
- Форматная строка
- Поставщики форматов (Format Providers)
- String.Format и смешанная форматная строка
- Интернирование строк
Тип string
(синоним System.String
) представляет беспрерывную последовательность юникод символов. Строковые литералы указываются внутри двойных кавычек.
String — ссылочный тип, однако операторы отношений взаимодействуют со строками как со значимыми типами:
string a = «test», b = «test»; Console.Write (a == b); // True |
Управляющие последовательности, применимые к типу char
, могут использоваться и внутри строк:
string a = «Here’s a tab:t»; |
Недостаток этого в том, что если нужно использовать символ обратного слэша , его нужно писать дважды (экранировать):
string a1 = «\\server\fileshare\helloworld.cs»; |
Чтобы избежать этой проблемы можно использовать дословные (буквальные, verbatim) строковые литералы. Эти литералы начинаются с символа @
и не поддерживают управляющих последовательностей. Они могут занимать несколько строк. Чтобы использовать внутри дословных литералов двойные кавычки их нужно писать дважды.
string a2 = @»\serverfilesharehelloworld.cs»; |
Объединение (concatenation) строк
Оператор +
объединяет две строки:
Один из операндов может быть и не строкой. В этом случает для него скрыто будет вызван метод ToString
:
string s = «a» + 5; // a5 |
Многократное использование оператора +
для построения большой составной строки может быть не эффективным. Для этой цели лучше использовать тип System.Text.StringBuilder
, который представляет динамически изменяющуюся строку и включает методы Append
, Insert
, Remove
, и Replace
.
Сравнение строк
Строки не поддерживают операторы <
и >
. Вместо них для сравнения строк нужно использовать строковой метод CompareTo
, который возвращает 1
если первая строка предшествует второй, -1
если вторая строка предшествует первой и 0
если строки равны:
Console.Write («Boston».CompareTo («Austin»)); // 1 Console.Write («Boston».CompareTo («Boston»)); // 0 Console.Write («Boston».CompareTo («Chicago»)); // -1 |
Поиск в строке и перечисление
Строковой индексатор возвращает символ с указанной позицией:
Console.Write («word»[2]); // r |
string
реализует интерфейс IEnumerable<char>
, поэтому по символам строки можно проходить с помощью foreach
:
foreach (char c in «123») Console.Write (c + «,»); // 1,2,3, |
Простейшими методами для выполнения поиска в строке являются Contains
, StartsWith
, и EndsWith
, все они возвращают true
или false
:
Console.WriteLine («quick brown fox».Contains («brown»)); // True Console.WriteLine («quick brown fox».EndsWith («fox»)); // True |
Метод IndexOf
возвращает позицию первого вхождения заданного символа или подстроки (или -1
если символ или подстрока не найдены):
Console.WriteLine («abcde».IndexOf(«cd»)); // 2 |
Методы StartsWith
, EndsWith
и IndexOf
перегружены и могут принимать enum StringComparison
или объект CultureInfo
, чтобы управлять чувствительность к регистру и культуре:
«abcdef».StartsWith(«abc», StringComparison.InvariantCultureIgnoreCase) |
Метод IndexOf
также может принимать startPosition
— индекс, с которого должен начинаться поиск.
Метод LastIndexOf
похож на IndexOf
, но ищет начиная с конца строки.
Метод IndexOfAny
возвращает позицию первого вхождения любого символа из набора, а метод LastIndexOfAny
делает тоже самое в обратном направлении:
Console.Write («ab,cd ef».IndexOfAny (new char[] {‘ ‘, ‘,’} )); // 2 Console.Write («pas5w0rd».IndexOfAny («0123456789».ToCharArray() )); // 3 |
Строковые операции
Поскольку строка является неизменной, все ее методы возвращают новое значения, оставляя исходную строку нетронутой. Помимо указанных выше строка имеет следующие методы:
Substring
— извлекает часть строкиInsert
иRemove
— вставляют и удаляют символы в указанную позициюPadLeft
иPadRight
— добавляют пробелы в начали и конце строкиTrimStart
,TrimEnd
, иTrim
удаляют пробелыToUpper
иToLower
— преобразуют строку в верхний или нижний регистрSplit
— разбивает строку на подстроки по переданному разделителюJoin
— объединяет подстроки в строку
Конструирование строк
Простейший способ создать строку — это присвоение литерала:
Чтобы создать строку из повторяющейся последовательности символов можно использовать конструктор string
:
Console.Write (new string (‘*’, 10)); // ********** |
Строку можно сконструировать из массива char
. Метод ToCharArray
делает обратное:
char[] ca = «Hello».ToCharArray(); string s = new string (ca); // s = «Hello» |
null и пустые строки
Чтобы создать пустую строку можно использовать литерал, либо статическое поле string.Empty
. Пустая строка имеет нулевую длину и ее свойство Length
равно нулю:
string empty = «»; Console.WriteLine (empty == «»); // True Console.WriteLine (empty == string.Empty); // True Console.WriteLine (empty.Length == 0); // True |
Поскольку строки являются ссылочными типами они могут принимать значение null
:
string nullString = null; Console.WriteLine (nullString == null); // True Console.WriteLine (nullString == «»); // False Console.WriteLine (nullString.Length == 0); // NullReferenceException |
Статический метод string.IsNullOrEmpty
позволяет проверить является ли строка null
или пустой.
Методы манипулирования строками
Поскольку строка является неизменяемой, все методы манипулирующие строкой возвращают новую строку, оставляя исходную незатронутой.
Метод Substring
извлекает часть строки:
string left3 = «12345».Substring (0, 3); // left3 = «123»; string mid3 = «12345».Substring (1, 3); // mid3 = «234»; string end3 = «12345».Substring (2); // end3 = «345»; |
Методы Insert
и Remove
вставляют либо удаляют символы в указанной позиции:
string s1 = «helloworld».Insert (5, «, «); // s1 = «hello, world» string s2 = s1.Remove (5, 2); // s2 = «helloworld»; |
Методы PadLeft
и PadRight
дополняют строку до заданной длины слева или справа указанным символом или пробелом если символ не указан. Если входная строка длиннее заданной длины для дополнения, исходная строка возвращается неизмененной:
Console.WriteLine («12345».PadLeft (9, ‘*’)); // ****12345 Console.WriteLine («12345».PadLeft (9)); // 12345 |
Методы TrimStart
и TrimEnd
удаляют указанные символы с начала или конца строки, а метод Trim
с двух сторон. Если символ для удаления не указан, удаляется пробельные символы:
Console.WriteLine (» abc trn «.Trim().Length); // 3 |
Метод Replace
заменяет все непересекающиеся вхождения заданного символа или подстроки на другой символ или строку:
Console.WriteLine («to be done».Replace (» «, » | «) ); // to | be | done Console.WriteLine («to be done».Replace (» «, «») ); // tobedone |
Методы ToUpper
и ToLower
возвращают версию входной строки в верхнем или нижнем регистре с учетом языковых настроек пользователя, а методы ToUpperInvariant
и ToLowerInvariant
без их учета.
Объединение и разбиение строк
Метод Split
принимает предложение и возвращает массив слов. По умолчанию в качестве разделителей метод использует пробельные символы. Перегруженная версия может принимать массив разделителей char
или string
. Также метод может принимать enum StringSplitOptions
, который имеет опцию для удаления пустых элементов.
string[] words = «The quick brown fox».Split(); foreach (string word in words) Console.Write (word + «|»); // The|quick|brown|fox| |
Статический метод Join
выполняет действие противоположное методу Split
. Он требует указания разделителя и строкового массива.
string[] words = «The quick brown fox».Split(); string together = string.Join (» «, words); // The quick brown fox |
Статический метод Concat
похож на Join
, но принимает только строковой массив без разделителя. Он полностью эквивалентен операции +
:
string sentence = string.Concat («The», » quick», » brown», » fox»); string sameSentence = «The» + » quick» + » brown» + » fox»; |
Сравнение строк
При сравнении строк применяются два базовых алгоритма:
- ординальное сравнение — символы интерпретируются как числа согласно их числовым кодам в Unicode
- сравнение чувствительно к культуре — символы интерпретируются со ссылкой на конкретный язык. Существует две специальные культуры: текущая культура — культура заданная в настройках конкретной машины; инвариантная культура — одинакова для всех компьютеров (американская культура)
Для сравнения эквивалентности строк можно использовать оператор ==
или один из методов Equals
типа string
. Последний существует в двух вариантах: статический и экземплярный. Статически метод полезен тем, что он работает, когда одна или обе строки равны null
:
public bool Equals (string value, StringComparison comparisonType); public static bool Equals (string a, string b, StringComparison comparisonType); |
Оператор ==
и метод string.Equals
вызванный без параметров всегда выполняют ординальное сравнение, чувствительное к регистру. Метод string.Equals
вызванный с дополнительным параметром StringComparison comparisonType
может выполнять сравнение с учетом культуры и нечувствиетльное к регистру. StringComparison
определен следующим образом:
public enum StringComparison { CurrentCulture, // Чувствительное к регистру CurrentCultureIgnoreCase, InvariantCulture, // Чувствительное к регистру InvariantCultureIgnoreCase, Ordinal, OrdinalIgnoreCase } |
Пример:
Console.WriteLine (string.Equals («foo», «FOO», StringComparison.OrdinalIgnoreCase)); // True Console.WriteLine («ṻ» == «ǖ»); // False Console.WriteLine (string.Equals («ṻ», «ǖ», StringComparison.CurrentCulture)); // Зависит от настроек локали |
Для сравнения порядка могут быть использованы либо экземплярный метод CompareTo
, либо статические Compare
и CompareOrdinal
. Они возвращают положительное, отрицательное число либо ноль в зависимости от того находится ли первое значение до, после или рядом со вторым.
Метод CompareTo
выполняет чувствительное к культуре и регистру сравнение. Методы Compare
и CompareOrdinal
в зависимости от переданных аргументов могут выполнять разные виды сравнения:
public int CompareTo (string strB); public static int Compare (string strA, string strB, StringComparison comparisonType); public static int Compare (string strA, string strB, bool ignoreCase, CultureInfo culture); public static int Compare (string strA, string strB, bool ignoreCase); public static int CompareOrdinal (string strA, string strB); |
Примеры:
Console.WriteLine («Boston».CompareTo («Austin»)); // 1 Console.WriteLine («Boston».CompareTo («Boston»)); // 0 Console.WriteLine («Boston».CompareTo («Chicago»)); // −1 Console.WriteLine («ṻ».CompareTo («ǖ»)); // 0 Console.WriteLine («foo».CompareTo («FOO»)); // −1 Console.WriteLine (string.Compare («foo», «FOO», true)); // 0 // CultureInfo is defined in the System.Globalization namespace CultureInfo german = CultureInfo.GetCultureInfo («de-DE»); int i = string.Compare («Müller», «Muller», false, german); |
StringBuilder
Класс System.Text.StringBuilder
представляет изменяемую (редактируемую) строку. С его помощью можно добавлять (метод Append
), вставлять (Insert
), удалять (Remove
) и заменять (Replace
) подстроки, не заменяя целиком StringBuilder
. Конструктор StringBuilder
дополнительно может принимать начальное значение строки, а также стартовую длину строки (по умолчанию 16 символов). Использование класса StringBuilder
для построения строк более эффективно, чем выполнение множества конкатенаций строк.
StringBuilder sb = new StringBuilder(); for (int i = 0; i < 50; i++) sb.Append (i + «,»); Console.WriteLine (sb.ToString()); // Результат: 0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26, 27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49, |
Метод AppendLine
добавляет подстроку и завершает ее символами новой строки (rn
). Метод AppendFormat
принимает смешанную форматную строку точно как String.Format
. Класс StringBuilder
также содержит свойство Length
и индексатор для получения и установки отдельных символов.
Для очистки содержимого StringBuilder
нужно либо создать новый экземпляр, либо установить его свойство Length
равным 0
(последний вариант не уменьшит объем занимаемой памяти).
Кодировка
Стандартной кодировкой .NET для символов и строк является UTF-16, а для потокового ввода-вывода — UTF-8.
Класс System.Text.Encoding
является базовым классом для типов, инкапсулирующих кодировки текста. Создать экземпляр Encoding
можно с помощью статического метода Encoding.GetEncoding
, передав ему стандартное имя IANA:
Encoding utf8 = Encoding.GetEncoding («utf-8»); Encoding chinese = Encoding.GetEncoding («GB18030»); |
Экземпляры наиболее распространенных кодировок также могут быть получены через статические свойства Encoding
:
Encoding.UTF8 Encoding.Unicode // utf-16 Encoding.UTF32 Encoding.ASCII |
Статический метод GetEncodings
возвращает список всех поддерживаемых кодировок:
foreach (EncodingInfo info in Encoding.GetEncodings()) Console.WriteLine (info.Name); |
Также экземпляр Encoding
можно создать с помощью конструктора. В этом случае можно задать дополнительные параметры, передав необходимые аргументы.
Форматирование и разбор (Formatting and Parsing)
Форматирование — преобразование в строку, разбор (парсинг) — преобразование из строки.
Методы ToString и Parse
Методы ToString
и Parse
являются стандартным механизмом для форматирования и разбора строк. ToString
обеспечивает осмысленный вывод для всех простых значимых типов (bool
, DateTime
, DateTimeOffset
, TimeSpan
, Guid
и всех числовых типов). Для обратной операции в каждом из указанных типов определен статический метод Parse
:
string s = true.ToString(); // s = «True» bool b = bool.Parse (s); // b = true |
Метод Parse
генерирует исключение FormatException
в случае неудачной попытки разбора. Многие типы также определяют метод TryParse
, который в случае неудачной попытки разбора возвращает false
вместо генерации исключения.
Методы ToString
, Parse
и TryParse
для числовых типов и классов DateTime
и DateTimeOffset
учитывают местные настройки культуры. Также им можно передать объект CultureInfo
, содержащий иные настройки культуры, которые будут использованы вместо местных:
Console.WriteLine (double.Parse («1.234»)); // В России даст 1234 double x = double.Parse («1.234», CultureInfo.InvariantCulture); // 1,234 string x = 1.234.ToString (CultureInfo.InvariantCulture); |
Интерфейс IFormattable
Метод ToString
числовых типов и типов DateTime
/DateTimeOffset
реализует интерфейс IFormattable
— стандартный интерфейс для поддержки форматных строк и поставщиков форматов:
public interface IFormattable { string ToString (string format, IFormatProvider formatProvider); } |
В связи с этим метод ToString
указанных типов может принимать в качестве дополнительных аргументов форматную строку и/или поставщиков форматов. Форматная строка предоставляет инструкции, поставщик формата определяет, как эти инструкции должны применяться:
NumberFormatInfo f = new NumberFormatInfo(); f.CurrencySymbol = «$»; Console.WriteLine (3.ToString («C», f)); // $ 3.00 |
В примере "C"
— форматная строка, которая означает денежное значение (currency), а объект NumberFormatInfo
— поставщик формата, определяющий, как должно визуализироваться денежное значение.
Если для форматной строки и поставщика указать null
, будут использованы стандартные варианты. Стандартный поставщик формата — CultureInfo.CurrentCulture
, который отражает настройки панели управления компьютера во время выполнения:
Console.WriteLine (10.3.ToString («C», null)); // $10.30 |
Для удобства большинство типов перегружаю метод ToString
, чтобы null
для поставщика можно было не указывать:
Console.WriteLine (10.3.ToString («C»)); // $10.30 Console.WriteLine (10.3.ToString («F4»)); // 10.3000 |
Вызов ToString
без аргументов эквивалентен использованию стандартного поставщика формата с пустой форматной строкой.
Форматная строка
Существует два вида форматных строк:
- стандартные форматные строки — обеспечивают общее управление форматированием при преобразовании числа или даты/времени в строку; состоят из одной буквы, за которой может следовать цифра
- специальные форматные строки — позволяют контролировать при форматировании каждый символ с помощью шаблона, сотоящего из произвольного количества предопределенных символов
Подробно форматные строки для чисел и даты/времени рассматриваются в разделах, посвященных этим типам.
Поставщики форматов (Format Providers)
Поставщики форматов дают большую гибкость при форматировании и разборе строки, а также чувствительны к культуре. В .NET определены три поставщика формата (все реализуют интерфейс IFormatProvider
):
NumberFormatInfo
DateTimeFormatInfo
CultureInfo
Все типы enum
также поддерживают форматирование, но специальный поставщик формата для них не предусмотрен.
В контексте поставщиков формата CultureInfo
представляет собой механизм косвенного обращения к двум другим поставщикам формата — NumberFormatInfo
или DateTimeFormatInfo
. Он возвращает NumberFormatInfo
или DateTimeFormatInfo
применимый к региональным настройкам культуры:
CultureInfo uk = CultureInfo.GetCultureInfo («en-GB»); Console.WriteLine (3.ToString («C», uk)); // £3.00 |
В следующем примере показано как можно использовать поставщик формата NumberFormatInfo
. В примере создается экземпляр поставщика и изменяется разделитель групп с запятой на пробел:
NumberFormatInfo f = new NumberFormatInfo (); f.NumberGroupSeparator = » «; Console.WriteLine (12345.6789.ToString («N3», f)); // 12 345.679 |
Начальные настройки поставщиков NumberFormatInfo
и DateTimeFormatInfo
основаны на инвариантной культуре.
Все поставщики форматов реализуют интерфейс IFormatProvider
:
public interface IFormatProvider { object GetFormat (Type formatType); } |
За счет реализации этого интерфейса, а также интерфейса ICustomFormatter
, можно создавать собственные поставщики формата. Их можно использовать только в смешанных форматных строках. Интерфейс ICustomFormatter
определен следующим образом:
string Format (string format, object arg, IFormatProvider formatProvider); |
String.Format и смешанная форматная строка
Статический метод Format
предоставляет удобный способ построения строк путем внедрения в нее значений переменных. Внедряемые переменные могут быть любого типа, метод Format просто вызывает на них ToString
. Первым аргументом методу передается смешанная форматная строка (строка в которую внедряются переменные), а за ней по очереди все внедряемые переменные:
string composite = «It’s {0} degrees in {1} on this {2} morning»; string s = string.Format (composite, 35, «Perth», DateTime.Now.DayOfWeek); // s == «It’s 35 degrees in Perth on this Friday morning» |
Числа в фигурных скобках называются форматными переменными. Число соответствует позиции аргумента, а за ним может дополнительно следовать запятая и минимальная ширина и/или двоеточие и форматная строка. Минимальная ширина предназначена для выравнивания колонок (отрицательные значения выравнивают влево, положительные — вправо):
string composite = «Name={0,-20} Credit Limit={1,15:C}»; Console.WriteLine (string.Format (composite, «Mary», 500)); Console.WriteLine (string.Format (composite, «Elizabeth», 20000)); // Результат: Name=Mary Credit Limit= $500.00 Name=Elizabeth Credit Limit= $20,000.00 |
Смешанную форматную строку также можно добавлять к StringBuilder
(через метод AppendFormat
) и к TextWriter
для ввода-вывода.
Метод string.Format
может также принимать необязательный поставщик формата:
string s = string.Format (CultureInfo.InvariantCulture, «{0}», someObject); |
Интернирование строк
Интернирование строк — это механизм, при котором одинаковые литералы представляют собой один объект в памяти. В рамках процесса существует одна внутренняя хеш-таблица, ключами которой являются строки, а значениями — ссылки на них. Во время компиляции литеральные строки последовательно заносятся в эту таблицу. Каждая строка в таблице встречается только один раз. На этапе выполнения ссылки на литеральные строки присваиваются из этой таблицы. Можно поместить строку во внутреннюю таблицу во время выполнения с помощью метода String.Intern
. Также можно проверить, содержится ли строка во внутренней таблице с помощью метода String.IsInterned
.
Например, следующий код вернет true
, т.к. оба параметра ссылаются на один объект из внутренней хэш-таблицы:
string str = “literal string”; return object.ReferenceEquals(str, “literalstring”); |
Строки, формирующиеся динамически, во внутреннюю хэш-таблицу не заносятся. Чтобы механизм интернирования заработал для них, их нужно вручную добавить в хэш-таблицу с помощью метода String.Intern
:
string str = “literal”; str += “ string”; // Создает новую строку // без следующей строчки кода, метод вернул бы false str = string.Intern(str); return object.ReferenceEquals(str, “literalstring”); |
Интернирование позволяет сэкономить память и ускорить сравнение строк. Однако сам процесс добавления строк в хэш-таблицу может быть весьма ресурсоемким.