C++的类型¶

约 1029 个字 129 行代码预计阅读时间 5 分钟

与C相同的略。主要包含string, enum

string 类¶

#include <string>

初始化方法：¶

默认空串

除了常用的构造函数，还有：

string(const string& str, int pos, int len) 表示从下标pos开始，复制str的len个字符
string(const char* s, size_t n) 复制C风格字符串的前n个字符
string(size_t n, char c) 生成n个c字符的字符串

基本特性¶

同样有size和capacity，capacity更大，capacity为排除’0‘之后的容积
用.empty()判断空串。可以直接使用==和!=判断string字符串是否相等，可以使用<或>按字典序直接比较
可以使用+来进行字符串拼接，使用+=来append
可以像char数组一样用[]访问字符

成员函数¶

str.length()

//截取拼接
str.substr(int pos) //取从pos开始直到末尾的字符串
str.substr(int pos, int len)
str.append(const string& str);

//插入删除
str.insert(size_t pos, const string& s);
str.erase(size_t pos = 0, size_t len = npos);

//查找
size_t str.find(const string& str, size_t pos =0) 
if (str.find(substr) == string::npos){// (1)!
    // string::npos 为string的静态成员常量，值为最大size_t值，表示没找到
    cout << "Not found!" << endl;
}

//替换：从pos开始的len个字符，替换成str
str.replace(size_t pos, size_t len, const string& str);

```
#include <iostream>
#include <string>
using namespace std;

int main() {
    string str("Hello, World!");
    cout << (str.find("7788") == -1) << endl;
    cout << str.find("7788")<< endl;
    return 0;
}
```
This code’s output is:
```
1
18446744073709551615
```
如果没有找到子串， str.find(“7788”) 将返回 std::string::npos ，这是一个无符号值，通常等于 size_t 可表示的最大值（64 位系统上为 18446744073709551615）。将该值与 -1 比较时，字面量 -1 会被隐式转换为无符号 size_t 值。一个有符号数转为无符号数是对无符号数的最大值取mod，-1对 \(2^{64}\) 取模即为 \(2^{64}-1\) 。

之所以是-1被隐式转换而非size_t，是因为根据 C++ 标准的常规算术转换，当一个操作中有一个无符号整数和一个有符号整数时，如果无符号类型可以表示有符号类型的所有值，则有符号值将转换为无符号类型。由于 size_t 是无符号的，因此字面形式 -1 将被转换为 size_t 值。

注意上述成员函数.insert, .append, .erase, .replace都是就地修改(mutating)的！(而不是拷贝并返回一个新的str) 它们的返回值是对原string对象的引用，因此也允许链式调用：

std::string s = "abc";
s.append("XYZ")        // s: "abcXYZ"
.replace(0, 1, "A")   // s: "AbcXYZ"
.insert(2, 3, '-');   // s: "Ab---cXYZ"

字符串和数字转换¶

stoi() string to integer
stod() string to double
stof() string to float
stoll() strint to long long

auto num1 = stoi("1234");
auto num2 = stod("123.4");
auto num3 = stof("123.4");
auto num4 = stof("123.5f"); // 123.5f显式表示其为float类型

上述函数出错时会抛出异常可以被捕获

to_string() 重载了多种类型

cout << to_string(-123.4) << endl;

字符串拼接¶

可以通过 +或+=，或者append
也可以通过流 sstream：

#include <sstream>
#include <iomanip>
#include <iostream>
int main(){
    double x = 3.14159;
    int n = 7;

    std::ostringstream oss;
    oss << "x=" << std::fixed << std::setprecision(2) << x << ", n=" << std::setw(3) << std::setfill('0') << n; // 宽度3、前导0

    std::string s = oss.str(); 
    std::cout << s << std::endl;//(1)!
}

```
x=3.14, n=007
```

转换为const char *¶

比如当我们要使用cstdlib中的system()进行系统调用时，需要C语言风格字符串即const char * - str.c_str()

string cmd{"dir"};//windows cmd的命令
system(cmd.c_str());

技巧¶

批量进行string的字符替换

replace(str.begin(),str.end(),'a','b')//批量把a换成b

enum 类¶

c++11之前/C

enum LogLevel {
    DEBUG, //默认从0开始
    INFO//若无赋值，值为上一个枚举值+1
    ERROR = 5, //可赋值
    FATAL //依然为上一个枚举值+1 （枚举值=6）
};
cout << DEBUG <<endl;
LogLevel logLevel{FATAL};
if(logLevel == 6){
    cout << "FATAL!" << endl;
}
int val_error = ERROR
if(logLevel == val_error){
    cout << "ERROR!" << endl;
}

用于消息类型/日志级别可以当成整数使用容易跟宏或者别的枚举类型混淆（所以会定义成LOGLEVEL_ERROR）

c++11之后

enum class LogLevel {
    DEBUG, 
    INFO,
    ERROR,
    FATAL
};
cout << (int)LogLevel::DEBUG <<endl;
int val_error = static_cast<int>(LogLevel::ERROR)

无法直接当成整数使用，必须显式类型转换

类型推导(auto关键字)¶

auto会删除引用(&)和, const, 和volatile关键字

#include <iostream>
using namespace std;
 
int main( )
{
    int count = 10;
    int& countRef = count;
    auto myAuto = countRef;
 
    countRef = 11;
    cout << count << " ";
 
    myAuto = 12;
    cout << count << endl;//(1)!
}

输出为:

11 11

因为此处的auto为int而非int& 但如果是如下代码,则可得输出 11 12:

auto & myAuto1 = countRef;
countRef = 11;
cout << count << " ";
myAuto1 += 1;
cout << count << endl;

同样地,若要使用const, 需写成const auto或const auto&

C++的字面量相较于C语言的区别¶

参见C语言字面量

bool类型内建, true和false为关键字
空指针字面量nullptr, 类型为std::nullptr_t, 避免重载时NULL和0的歧义

窄字符串字面量

C：”abc” 的类型是 char[4]（可转换为 char*，理论上能修改，虽然改字符串字面量是 UB）
C++：”abc” 的类型是 const char[4]（不可修改)

/* C 里不少编译器会给警告但能过：*/
char *p = "abc";   // C

// char *p = "abc"; // 在C++中是错误,无法通过语法检查("const char*类型不能用于初始化char*类型的实体")
const char *p = "abc";  // 正确写法

- Unicode字面量写法和C中相同, C++11中char16_t和char32_t为内建类型, 而C11依靠<uchar.h>

auto s8  = u8"你好";   // UTF-8 窄字符串
auto s16 = u"你好";    // char16_t[]
auto s32 = U"你好";    // char32_t[]
auto wc  = L"你好";    // wchar_t[]

- Raw string 字面量

const char* pat = R"(\d+\s+".*")";
// 实际内容是：\d+\s+".*"

const wchar_t* wpat = LR"(行首^\s+行尾$)";
const char16_t* s16 = uR"(路径 C:\temp\foo.txt)";

中间的内容几乎不需要转义，可以直接放反斜杠和双引号；前面可以配合 u8, u, U, L 形成不同字符集的原始字符串。

用户自定义字面量通过重载字面量后缀实现operator""

// 把浮点字面量加后缀 _km 变成“米”
long double operator"" _km(long double x) {
    return x * 1000.0L;
}

auto d = 1.2_km;  // d == 1200.0L

char*, vector, string之间的高效转换(对于二进制数据的处理)¶

尽量不写循环

对于字符串长度
- char[]的strlen不包含\0
- string类默认不带\0,即用字符串常量初始化时不会读入\0
- vector<unsigned char>将\0字符当作普通数组元素对待

#include<vector>
#include<iostream>
#include<string>
using namespace std;

int main(){
    /*字符串转换为vector<unsigned char>, 初始化一个新的vector*/
    const char* cstr{ "测试const char *到vector" };
    int size = strlen(cstr);      
    //cstr+size是'\0'的下标
    //vector的构造可以使用.begin()和.end() iterator (对于字符串即为地址)
    //而end是'\0'的再下一位(nullptr)
    vector<unsigned char> data(cstr, cstr+size+1)
    cout << data.data() << endl; //堆空间.data()可以当作字符串打印!
    cout << size <<" " << data.size() << endl //输出24 25, 因为vector<unsigned char>的size包含了'\0'
    

    /*字符串转换为vector<unsigned char>, 内存移动给已有的vector*/
    char astr[]{ "测试数组到vector"};
    data.clear();
    data.assign(astr, astr+sizeof(astr));
    // void assign(const_iterator first,const_iterator last);相当于copy()函数
    cout << sizeof(astr) <<" "<< data.size()<<endl //输出17 17, sizeof()包含'\0'
    

    /*string转换为vector*/
    string str{"测试string到vector"}
    data.clear();
    data.assign(str.begin(), str.end()); //直接使用string类的begin()和end()不能复制'\0'! string类的size是不包含'\0'的.
    data.push_back('\0');
    cout << str.size() <<" "<< data.size()<<endl//输出18 19
    
    /*string转换为vector, 第二种方法*/
    string str{"测试string到vector"}
    data.clear();
    data.assign(str.data(), str.data()+str.size()+1); 
    // string类的size()和length()不包含'\0'!
    cout << str.size() <<" "<< data.size()<<endl// 输出18 19

    /*vector转string*/
    string outstr(data.begin(), data.end());
    cout << outstr.size() <<" "<<data.size()<<endl//输出19 19
    //在这种情况下, outstr的最后一个字符又是'\0'了
    //
}