CS110L(Rust)
1.Rust 语法总结
数值类型
- 有符号整数: i8, i16, i32, i64
- 无符号整数: u8, u16, u32, u64
变量声明
- 声明变量:
let i = 0; // 类型推断 let n: i32 = 1; // 显式类型声明
- 可变变量:
let mut n =0; n = n + 1;
字符串
注意,let s: str = "Hello world"; 是不正确的,因为 str 类型不能单独使用。它必须通过引用(&str)来使用。
集合
- 动态数组(向量):
let mut v: Vec = Vec::new(); v.push(1); v.push(0);
- 固定大小数组:
-
在 Rust 中,所有变量在使用之前必须初始化。这是为了防止未初始化变量引起的未定义行为。因此,您不能声明一个未初始化的数组或变量。
-
// 创建一个可变数组 `arr`,包含4个 `i32` 类型的元素,将所有元素初始化为0 let mut arr: [i32; 4] = [0; 4]; // 或者,可以逐个初始化每个元素 let mut arr: [i32; 4] = [0, 0, 0, 0]; // 修改数组的元素 arr[0] = 0; arr[1] = 1; arr[2] = 2; arr[3] = 3;
循环
- 迭代器循环:
// 使用 for 循环迭代向量中的元素 for i in v.iter() { println!("{}", i); // 打印每个元素 } - while 循环:
while i
- 无限循环:
fn main() { let mut i = 0; // 初始化一个可变变量 i,初始值为 0 loop { i += 1; // 每次循环迭代将 i 的值增加 1 if i > 10 { // 检查 i 是否大于 10 break; // 如果 i 大于 10,则退出循环 } } println!("Final value of i: {}", i); // 打印 i 的最终值 }函数
fn sum(a: i32, b: i32) -> i32 { a + b }- 声明函数:
fn sum(a: i32, b: i32) -> i32 { a + b }表达式
- 三元表达式:
let x = if someBool { 2 } else { 4 }输入输出
(1)确保所有缓冲区中的数据都被写入到标准输出(通常是终端或控制台)中
io::stdout().flush().unwrap();
(2)read_line 方法从标准输入读取用户输入并将其存储到 guess 中。如果读取失败,程序会崩溃并显示错误信息 "读取输入失败."。
let mut guess = String::new(); io::stdin().read_line(&mut guess).expect("读取输入失败.");操作符
(1)? 操作符
当一个函数返回 Result 或 Option 类型时,可以使用 ? 操作符来自动处理这些结果。如果结果是 Ok,则返回其中的值;如果是 Err,则返回错误并退出当前函数。
fn read_file_lines(filename: &str) -> Result { // 尝试打开文件 let file = File::open(filename)?; // 如果成功打开文件,继续执行;如果失败,返回错误并退出函数 }定义结构体
在 Rust 中,定义结构体类型时,我们声明了结构体的字段及其类型,而不是创建具体的实例。因此,不需要使用 let 或 let mut 这样的关键字。let 和 let mut关键字用于创建变量,而不是定义类型。
在这段代码中,我们定义了一个名为 Node 的泛型结构体类型,它包含三个字段:
- elem:类型为 T,表示节点存储的值。
- next:类型为 Link,表示下一个节点的引用。
- prev:类型为 Link,表示前一个节点的引用。
这个定义仅仅是声明了 Node 结构体的形状,并没有创建任何实际的 Node 实例。
impl 块
Rust 中的 impl 块类似于其他编程语言中的 class 定义,但有一些关键的不同之处。
类似点
-
方法定义:
- 在 impl 块中定义的方法类似于在类中定义的方法。
- 你可以定义实例方法和静态方法(Rust 中称为关联函数)。
-
封装:
- Rust 的 impl 块可以用于封装数据和行为,类似于类。
不同点
-
数据和行为的分离:
- 在 Rust 中,数据(通过结构体或枚举)和行为(通过 impl 块)是分开的。
- 在类中,数据和行为通常是在一个定义中。
-
没有继承:
- Rust 没有类的继承。相反,它使用特性(traits)来实现多态性。
- 类系统通常有继承和多态性机制。
-
所有权和借用:
- Rust 强调所有权和借用,确保内存安全。
- 类系统通常使用垃圾回收(如 Java)或手动内存管理(如 C++)。
struct Rectangle { width: u32, height: u32, } impl Rectangle { fn new(width: u32, height: u32) -> Rectangle { Rectangle { width, height } } fn area(&self) -> u32 { self.width * self.height } } fn main() { let rect = Rectangle::new(30, 50); println!("The area of the rectangle is {} square pixels.", rect.area()); }2.进阶用法
闭包
闭包是一种匿名函数,它允许捕获调用者作用域中的值,可以赋值给变量,也可以作为参数传递给其他函数。闭包在许多现代编程语言中作为核心特性被广泛使用。
示例代码:
fn main() { let x = 1; let sum = |y| x + y; assert_eq!(3, sum(2)); }闭包 sum 捕获了变量 x 并对其进行了操作。
使用闭包简化代码
传统函数实现:
fn muuuuu(intensity: u32) -> u32 { println!("muuuu....."); thread::sleep(Duration::from_secs(2)); intensity } fn workout(intensity: u32, random_number: u32) { // 根据 intensity 调整健身动作 }函数变量实现:
fn muuuuu(intensity: u32) -> u32 { println!("muuuu....."); thread::sleep(Duration::from_secs(2)); intensity } fn workout(intensity: u32, random_number: u32) { let action = muuuuu; // 根据 intensity 调整健身动作 }闭包实现:
fn workout(intensity: u32, random_number: u32) { let action = || { println!("muuuu....."); thread::sleep(Duration::from_secs(2)); intensity }; // 根据 intensity 调整健身动作 }通过闭包可以简化代码,并捕获外部变量,使得代码更具灵活性。
闭包的语法和类型推导
闭包的定义形式如下:
|param1, param2| { 语句1; 语句2; 返回表达式 }类型推导示例:
let sum = |x: i32, y: i32| -> i32 { x + y };不标注类型的闭包声明更简洁:
let sum = |x, y| x + y;
结构体中的闭包
在 Rust 中,实现一个简易缓存的设计可以通过使用结构体和闭包来实现。(闭包应该作为一个变量传递,并且使用泛型和特征约束来指定它的类型。
struct Cacher where T: Fn(u32) -> u32, { query: T, value: Option, }核心概念
-
闭包与特征约束:
- T: Fn(u32) -> u32 表示 T 是一个实现了 Fn(u32) -> u32 特征的类型,这意味着 query 是一个闭包或函数,接受一个 u32 类型的参数并返回一个 u32 类型的值。
- 每个闭包都有其唯一的类型,即使它们的签名相同。
-
结构体设计:
- query 字段是一个闭包,用于获取值。
- value 字段用于存储缓存的值,初始为 None。
实现方法
为 Cacher 结构体实现方法:
impl Cacher where T: Fn(u32) -> u32, { fn new(query: T) -> Cacher { Cacher { query, value: None, } } fn value(&mut self, arg: u32) -> u32 { match self.value { Some(v) => v, None => { let v = (self.query)(arg); self.value = Some(v); v } } } }主要步骤
-
创建缓存实例:
- 使用 Cacher::new 创建新的缓存实例,传入一个闭包或函数作为 query。
-
查询缓存值:
- value 方法首先检查 self.value 是否已有缓存值。
- 如果没有,调用 query 获取新值,并将其存储在 self.value 中。
泛型扩展
为了支持其他类型(如 &str),可以将 u32 替换为泛型类型 E。
struct Cacher where T: Fn(E) -> E, { query: T, value: Option, } impl Cacher where T: Fn(E) -> E, E: Copy, { fn new(query: T) -> Cacher { Cacher { query, value: None, } } fn value(&mut self, arg: E) -> E { match self.value { Some(v) => v, None => { let v = (self.query)(arg); self.value = Some(v); v } } } }闭包的特征(重要)
1. FnOnce:转移所有权
- 语法:move || { ... }
- 解释:move 关键字用于指示闭包获取其捕获变量的所有权。
- 示例:
fn main() { let x = String::from("Hello"); let consume_x = move || { println!("{}", x); // x 被转移到闭包中,闭包执行后 x 的所有权已被消耗 }; consume_x(); // 第一次调用成功 // consume_x(); // 再次调用会报错,因为 x 的所有权已被消耗 }2. FnMut:可变借用
- 语法:|mut param| { ... }
- 解释:通过 mut 关键字在参数中表示可变借用,允许闭包内部修改捕获的变量。
- 示例:
fn main() { let mut x = 0; let mut add_to_x = |y| { x += y; }; add_to_x(5); // x 现在是 5 add_to_x(3); // x 现在是 8 }3. Fn:不可变借用
- 语法:|| { ... }
- 解释:不需要特殊标记,默认情况下,闭包捕获变量是不可变借用。
- 示例:
fn main() { let x = 10; let print_x = || { println!("{}", x); }; print_x(); // 打印 10 print_x(); // 可以多次调用,因为 x 只是被不可变地借用 }闭包的生命周期
-
捕获变量的生命周期:
- 闭包捕获的变量在闭包的生命周期内必须是有效的。
- 如果闭包捕获的是借用(&),则闭包的生命周期不能超过被借用变量的生命周期。
-
闭包的生命周期:
- 闭包的生命周期不能超过其捕获变量的生命周期。
- 使用 move 关键字可以将变量的所有权移动到闭包中,使得变量的生命周期延长到与闭包相同。
-
生命周期标注:
- 在复杂情况下,可以显式地标注闭包和捕获变量的生命周期,以确保它们之间的关系是有效的。
示例总结
以下是一个示例,展示了闭包捕获变量并在闭包生命周期内使用:
fn main() { let closure = create_closure(); println!("Closure result: {}", closure(5)); } fn create_closure() -> impl Fn(i32) -> bool { let x = 10; move |z| z- x 被闭包捕获并使用,通过 move 关键字将其所有权移动到闭包中。
- 闭包的生命周期因此延长,可以在 create_closure 函数结束后继续有效。
(2)all 方法
fn all(&mut self, f: F) -> bool where F: FnMut(Self::Item) -> bool,它接受一个闭包 f 作为参数,并对迭代器中的每个元素应用这个闭包。all 方法会返回一个布尔值:
- 如果所有元素都满足闭包 f 的条件,则返回 true。
- 如果任何一个元素不满足闭包 f 的条件,则返回 false。
(3)迭代器
let chars_left = vec![false, true, false, true];
原理:
创建迭代器:
let iter = chars_left.iter();
迭代示例:
let first = iter.next(); // Some(&false) let second = iter.next(); // Some(&true) let third = iter.next(); // Some(&false) let fourth = iter.next(); // Some(&true) let none = iter.next(); // None
用法:
- 创建迭代器:通过调用集合的 iter、iter_mut 或 into_iter 方法创建迭代器。
- 遍历:使用 for 循环或 while let 语句。
- 常用方法:
- 转换:map、filter、enumerate、zip
- 收集:collect、fold
- 检查:all、any
- 链式调用:将多个迭代器方法链式调用以实现复杂的数据处理。
-
(1)转换:
- map():对每个元素应用一个函数,返回一个新的迭代器。
- filter():过滤符合条件的元素,返回一个新的迭代器。
- enumerate():为迭代器中的每个元素生成一个索引,返回 (索引, 元素) 对。
- zip():将两个迭代器合并为一个新的迭代器,生成 (元素1, 元素2) 对。
-
(2)收集:
- collect():将迭代器的所有元素收集到一个集合类型中,通常是一个向量(Vec)。
- fold():将迭代器的所有元素通过一个累积函数聚合为一个值。
-
(3)检查:
- all():检查是否所有元素都满足一个条件。
- any():检查是否有任意元素满足一个条件。
-
(4)链式调用:
将多个迭代器方法链式调用,以实现复杂的数据处理。例如:过滤、映射和收集的组合。
例子:
fn main() { let vec = vec![1, 2, 3, 4, 5]; // 使用迭代器遍历元素 for val in vec.iter() { println!("{}", val); } // 使用链式调用过滤和映射元素,然后收集结果 let processed: Vec = vec.iter() .filter(|&&x| x % 2 == 0) // 过滤出偶数 .map(|&x| x * 2) // 将每个偶数乘以 2 .collect(); // 收集结果到一个向量 println!("{:?}", processed); // 输出: [4, 8] }(4)枚举
同一化类型
实际项目简化片段
在实际项目中,通常需要处理多种类型的长连接。例如,我们有一个 WEB 服务,需要接受用户的长连接,这些连接可能是 TcpStream 或 TlsStream。为了用同一个函数处理这两种连接,我们可以使用枚举来简化代码。
假设我们有以下代码:
fn new(stream: TcpStream) { let mut s = stream; if tls { s = negotiate_tls(stream); } // websocket 是一个 WebSocket 或者 WebSocket 类型 websocket = WebSocket::from_raw_socket(s, ...); }使用枚举类型来简化处理
通过使用枚举类型,我们可以将 TcpStream 和 TlsStream 统一化处理:
enum WebSocketStream { Tcp(TcpStream), Tls(native_tls::TlsStream), } fn new(stream: WebSocketStream) { match stream { WebSocketStream::Tcp(tcp_stream) => { // 处理 TcpStream let websocket = WebSocket::from_raw_socket(tcp_stream, ...); } WebSocketStream::Tls(tls_stream) => { // 处理 TlsStream let websocket = WebSocket::from_raw_socket(tls_stream, ...); } } }通过这种方式,我们可以将 TcpStream 和 TlsStream 封装在一个枚举类型 WebSocketStream 中,并在同一个函数 new 中处理它们,简化了代码逻辑。
枚举类型
(1)Option类型
在 Rust 中,Option 类型是一种枚举,用于表示一个值可能存在(Some)或者不存在(None)
fn main() { let numbers = vec![1, 2, 3]; let empty: Vec = Vec::new(); match get_first_element(&numbers) { Some(value) => println!("第一个元素是: {}", value), None => println!("数组为空"), } match get_first_element(&empty) { Some(value) => println!("第一个元素是: {}", value), None => println!("数组为空"), } }(2)Result类型
Result:
- 用于表示一个操作的成功或失败。
-
在 Rust 中,Result 枚举类型需要两个类型参数:
- Result:表示操作的结果。
- Ok(T):表示操作成功,包含类型 T 的值。
- Err(E):表示操作失败,包含类型 E 的错误信息。
-
fn read_file_lines(filename: &str) -> Result { let file = File::open(filename)?; let reader = BufReader::new(file); let mut lines = Vec::new(); for line in reader.lines() { let line = line?; lines.push(line); } Ok(lines) }使用 Ok 包装一个值时,你实际上是在创建一个 Result 类型的实例,表示操作成功,并返回该值作为 Result 的成功变体。
模式匹配
(5)match 表达式
match 表达式是 Rust 中用于模式匹配的强大工具。它可以根据不同的模式执行不同的代码分支。
match value { pattern1 => expr1, pattern2 => expr2, _ => expr3, // 通配模式,匹配所有其他情况 }(6)读取文件
在 Rust 中读取文件的流程通常包括以下步骤:
- 导入必要的模块:包括文件系统和 I/O 操作的模块。
- 打开文件:使用 std::fs::File::open 方法打开文件,并处理可能的错误。
- 创建缓冲读取器(可选):如果逐行读取文件内容,可以使用 std::io::BufReader 创建一个缓冲读取器。
- 读取文件内容:根据需要选择读取文件内容的方法,例如逐行读取、一次性读取到字符串、一次性读取到字节数组等。
- 处理文件内容:对读取到的文件内容进行处理。
- 错误处理:在读取和处理文件内容的过程中,处理可能的错误。
方法一:逐行读取文件内容
关键点:使用 BufReader 和 lines 方法逐行读取文件
use std::fs::File; use std::io::{self, BufRead, BufReader}; fn read_file_lines(filename: &str) -> Result { let file = File::open(filename)?; // 打开文件 let reader = BufReader::new(file); // 创建缓冲读取器 reader.lines().collect() // 逐行读取并收集结果 } fn main() { match read_file_lines("example.txt") { Ok(lines) => lines.iter().for_each(|line| println!("{}", line)), Err(e) => eprintln!("Error reading file: {}", e), } }方法二:一次性读取整个文件内容到字符串
关键点:使用 read_to_string 方法一次性读取整个文件内容
use std::fs::File; use std::io::{self, Read}; fn read_file_to_string(filename: &str) -> Result { let mut file = File::open(filename)?; // 打开文件 let mut contents = String::new(); file.read_to_string(&mut contents)?; // 读取文件内容到字符串 Ok(contents) } fn main() { match read_file_to_string("example.txt") { Ok(contents) => println!("{}", contents), Err(e) => eprintln!("Error reading file: {}", e), } }方法三:一次性读取整个文件内容到字节数组
关键点:使用 read_to_end 方法一次性读取整个文件内容到字节数组
use std::fs::File; use std::io::{self, Read}; fn read_file_to_bytes(filename: &str) -> Result { let mut file = File::open(filename)?; // 打开文件 let mut contents = Vec::new(); file.read_to_end(&mut contents)?; // 读取文件内容到字节数组 Ok(contents) } fn main() { match read_file_to_bytes("example.txt") { Ok(contents) => println!("{:?}", contents), Err(e) => eprintln!("Error reading file: {}", e), } }方法四:使用 std::fs::read_to_string 直接读取整个文件到字符串
关键点:使用 fs::read_to_string 直接读取文件内容到字符串
use std::fs; fn read_file_to_string(filename: &str) -> Result { fs::read_to_string(filename) // 直接读取文件内容到字符串 } fn main() { match read_file_to_string("example.txt") { Ok(contents) => println!("{}", contents), Err(e) => eprintln!("Error reading file: {}", e), } }方法五:使用 std::fs::read 直接读取整个文件到字节数组
关键点:使用 fs::read 直接读取文件内容到字节数组
use std::fs; fn read_file_to_bytes(filename: &str) -> Result { fs::read(filename) // 直接读取文件内容到字节数组 } fn main() { match read_file_to_bytes("example.txt") { Ok(contents) => println!("{:?}", contents), Err(e) => eprintln!("Error reading file: {}", e), } }总结
- 逐行读取文件内容:使用 BufReader 和 lines 方法。
- 一次性读取整个文件内容到字符串:使用 read_to_string 方法。
- 一次性读取整个文件内容到字节数组:使用 read_to_end 方法。
- 直接读取整个文件到字符串:使用 fs::read_to_string 方法。
- 直接读取整个文件到字节数组:使用 fs::read 方法。
RefCell 概括
RefCell 是 Rust 提供的一种类型,用于在不可变的上下文中实现内部可变性。它允许你在运行时执行借用检查,以确保安全地修改数据。这在某些数据结构(如链表)和特定场景(如闭包或异步编程)中非常有用。
核心特点
-
内部可变性:
- 允许在不可变的上下文中修改数据。
- 使用 borrow() 获取不可变引用。
- 使用 borrow_mut() 获取可变引用。
-
运行时借用检查:
- 在借用时进行运行时检查,确保借用规则不被违反。
- 如果在借用过程中违反规则,会导致运行时错误。
-
典型用法:
- 适用于实现复杂数据结构,如链表、图等需要相互引用的结构。
- 适用于跨越函数的借用,尤其在闭包和异步编程中。
示例代码
use std::cell::RefCell; let x = RefCell::new(5); { let y = x.borrow(); println!("y: {}", *y); // 输出: y: 5 } { let mut z = x.borrow_mut(); *z = 10; println!("x: {}", x.borrow()); // 输出: x: 10 }Rc 的核心作用概括
Rc(Reference Counted)是 Rust 提供的一种智能指针,允许多个所有者共享同一个数据。
核心特点
-
共享所有权:
- 允许多个变量同时拥有同一个数据。
- 适用于需要在多个地方访问和使用同一个数据的场景。
-
自动管理内存:
- 通过引用计数管理数据的生命周期。
- 当最后一个引用被删除时,数据会自动释放。
-
单线程环境:
- 只能在单线程环境中使用。
- 如果需要在多线程环境中共享数据,使用 Arc(Atomic Reference Counted)。
使用场景
-
数据共享:
- 例如,在树或图数据结构中,多个节点可以共享同一个子节点。
-
不可变数据:
- 通常用于共享不可变数据,因为 Rc 默认不允许多个可变引用。
- 如果需要修改数据,可以结合 RefCell 使用。
示例代码
use std::rc::Rc; fn main() { let data = Rc::new(5); // 创建一个 Rc 指针,包含数据 5 let data1 = Rc::clone(&data); // 创建 data 的克隆引用 let data2 = Rc::clone(&data); // 创建 data 的另一个克隆引用 println!("Reference count: {}", Rc::strong_count(&data)); // 输出: 3 println!("data: {}", data); println!("data1: {}", data1); println!("data2: {}", data2); }Rc 的销毁时机
对于 Rc(Reference Counted)智能指针,当一个 Rc 实例超出其作用域时,引用计数会自动减少。如果引用计数减少到零,Rc 管理的数据将被释放。
use std::cell::RefCell; use std::rc::Rc; fn main() { { let data = Rc::new(RefCell::new(5)); // 创建一个包含 RefCell 的 Rc 指针 println!("Initial reference count: {}", Rc::strong_count(&data)); // 输出: 1 { let data1 = Rc::clone(&data); // 克隆 Rc 指针,引用计数增加到 2 println!("Reference count after creating data1: {}", Rc::strong_count(&data)); // 输出: 2 { let data2 = Rc::clone(&data); // 再次克隆 Rc 指针,引用计数增加到 3 println!("Reference count after creating data2: {}", Rc::strong_count(&data)); // 输出: 3 *data2.borrow_mut() = 10; // 修改数据 println!("Modified data through data2: {}", data.borrow()); // 输出: 10 } // data2 超出作用域,引用计数减少到 2 println!("Reference count after data2 goes out of scope: {}", Rc::strong_count(&data)); // 输出: 2 } // data1 超出作用域,引用计数减少到 1 println!("Reference count after data1 goes out of scope: {}", Rc::strong_count(&data)); // 输出: 1 } // data 超出作用域,引用计数减少到 0,数据被释放 // 由于 data 已经被释放,不能再访问它 }字符串操作
字符串替换
1. replace
- 适用类型: String 和 &str
- 参数:
- 第一个参数是要被替换的字符串。
- 第二个参数是新的字符串。
- 功能: 替换所有匹配的字符串,返回一个新的字符串。
示例代码:
fn main() { let string_replace = String::from("I like rust. Learning rust is my favorite!"); let new_string_replace = string_replace.replace("rust", "RUST"); dbg!(new_string_replace); }运行结果:
new_string_replace = "I like RUST. Learning RUST is my favorite!"
2. replacen
- 适用类型: String 和 &str
- 参数:
- 前两个参数与 replace 方法相同。
- 第三个参数表示替换的次数。
- 功能: 替换指定次数的匹配字符串,返回一个新的字符串。
示例代码:
fn main() { let string_replace = "I like rust. Learning rust is my favorite!"; let new_string_replacen = string_replace.replacen("rust", "RUST", 1); dbg!(new_string_replacen); }运行结果:
new_string_replacen = "I like RUST. Learning rust is my favorite!"
3. replace_range
- 适用类型: 仅适用于 String
- 参数:
- 第一个参数是要替换的字符串范围(Range)。
- 第二个参数是新的字符串。
- 功能: 直接在原字符串上替换指定范围内的内容,不返回新的字符串。
示例代码:
fn main() { let mut string_replace_range = String::from("I like rust!"); string_replace_range.replace_range(7..8, "R"); dbg!(string_replace_range); }运行结果:
string_replace_range = "I like Rust!"
字符串删除方法
1. truncate
- 功能: 从指定位置开始删除字符串中从该位置到结尾的全部字符。
- 特性: 直接操作原字符串,无返回值。如果指定位置不在字符边界上,则会发生错误。
示例代码:
fn main() { let mut string_truncate = String::from("测试truncate"); string_truncate.truncate(3); dbg!(string_truncate); }运行结果:
string_truncate = "测"
2. clear
- 功能: 清空字符串,删除字符串中的所有字符。
- 特性: 直接操作原字符串,相当于 truncate() 方法参数为 0。
示例代码:
fn main() { let mut string_clear = String::from("string clear"); string_clear.clear(); dbg!(string_clear); }运行结果:
string_clear = ""
字符串连接
1. 使用 + 或 += 操作符
-
要求:
- 右边的参数必须为字符串切片引用(&str)。
- 调用 + 操作符相当于调用了标准库中的 add 方法。
-
特性:
- 返回一个新的字符串。
- 变量声明可以不需要 mut 关键字修饰。
- 左边的字符串所有权会被转移。
示例代码:
fn main() { let string_append = String::from("hello "); let string_rust = String::from("rust"); let result = string_append + &string_rust; // string_append 的所有权被转移 let mut result = result + "!"; // `result + "!"` 中的 `result` 是不可变的 result += "!!!"; println!("连接字符串 + -> {}", result); }运行结果:
连接字符串 + -> hello rust!!!!
-
所有权转移示例:
fn main() { let s1 = String::from("hello,"); let s2 = String::from("world!"); let s3 = s1 + &s2; // s1 的所有权被转移 assert_eq!(s3, "hello,world!"); // println!("{}", s1); // 这行代码会报错,因为 s1 的所有权已被转移 } -
连续连接示例:
let s1 = String::from("tic"); let s2 = String::from("tac"); let s3 = String::from("toe"); // String = String + &str + &str + &str + &str let s = s1 + "-" + &s2 + "-" + &s3;s1 这个变量通过调用 add() 方法后,所有权被转移到 add() 方法里面, add() 方法调用后就被释放了,同时 s1 也被释放了。再使用 s1 就会发生错误。
2. 使用 format! 宏
- 适用: String 和 &str
- 特性: 类似于 print! 的用法,生成一个新的字符串。
示例代码:
fn main() { let s1 = "hello"; let s2 = String::from("rust"); let s = format!("{} {}!", s1, s2); println!("{}", s); }运行结果:
hello rust!
3.Rust特性
(1)所有权
所有权机制是Rust用来管理内存的一种系统,它确保了内存安全性并防止了许多常见的编程错误。以下是所有权机制的核心概念和规则:
1. 所有权规则
-
每个值在Rust中都有一个所有者:
- 所有者是一个变量,只有一个变量可以是某个值的所有者。
-
值在任一时刻只能有一个所有者:
- 当所有者变量超出作用域时,该值将被自动清理。
-
当所有者离开作用域时,该值将被丢弃:
- Rust在所有者超出作用域时自动调用drop函数来释放内存。
2. 所有权转移(Move)
-
(1)非 Copy trait 的类型赋值
let s = String::from("hello"); let s1 = s;- 在这个例子中,s的栈上的数据所有权被转移给 s1(堆上数据仍然不变,移动语义),因此在之后使用s1会导致编译错误。
-
(2)self 作为参数:
方法或函数以 self 作为参数时,会获取调用者的所有权,调用后原变量失效。
-
(3) 非引用参数:
类似地,函数以非引用类型参数接收变量时,也会获取其所有权。
-
(4)克隆
let s = String::from("hello"); let s1 = s.clone();在Rust中,使用clone方法可以进行深拷贝。深拷贝会复制堆上的数据,并在栈上创建一个新的所有权指向这块堆内存。结果是栈上和堆上都有独立的拷贝,因此两个变量互不影响。
-
(5) Copy trait 的类型
- 整数类型 (i32, u32, 等)
- 浮点数类型 (f32, f64)
- 布尔类型 (bool)
- 字符类型 (char)
- 元组(如果元组内的所有元素都实现了 Copy trait)
-
(6)无法copy的类型
-
非Copy类型:
- 复杂类型如String不实现Copy特性,因为它们涉及更复杂的内存管理。
- 不能对不实现Copy的类型进行直接赋值拷贝。
-
解决方案:
- 使用引用:对于无法实现Copy的类型,可以通过引用来解决所有权冲突。
-
fn main() { let x = (1, 2, (), "hello".to_string()); let y = (&x.0, &x.1, &x.2, &x.3); println!("{:?}, {:?}", x, y); }
3. 借用(Borrowing)
引用的可变性决定了你是否可以通过引用来修改所引用的值。
-
(1)不可变借用:
- 可以有多个不可变引用,但不能同时有可变引用。
let s = String::from("hello"); let r1 = &s; // 不可变引用 r1 let r2 = &s; // 不可变引用 r2 println!("r1: {}, r2: {}", r1, r2); // 可以同时使用多个不可变引用 -
(2)可变借用:
- 同一时间只能有一个可变引用,且不能同时存在不可变引用。
let mut s = String::from("hello"); let r1 = &mut s; // 可变引用 r1 r1.push_str(", world"); println!("{}", r1); // r1 修改了 s 的内容- 唯一的可变引用:在任何给定的时间点,一个变量只能有一个可变引用(&mut)。
- 不可变引用与可变引用互斥:在有可变引用存在时,不允许同时存在不可变引用(&)。反之,在存在不可变引用时,不允许存在可变引用。
这些规则确保了在访问和修改数据时不会出现竞争条件。
(3)注意:
1.不允许在存在不可变引用时修改原始变量
fn main() { let mut s = String::from("hello"); // 可变变量 `s` 被创建 let ref1 = &s; // 创建对 `s` 的不可变引用 `ref1` s = String::from("goodbye"); // 尝试修改 `s` 的值 println!("{}", ref3.to_uppercase()); // 使用 `ref3` 打印 `s` 的值 }一种修复方法是将 println! 语句移动到修改 s 之前,确保在修改 s 之前,所有的不可变引用都已经被使用完毕。例如:
fn main() { let mut s = String::from("hello"); let ref1 = &s; let ref2 = &ref1; let ref3 = &ref2; println!("{}", ref3.to_uppercase()); // 在修改 `s` 之前使用 `ref3` s = String::from("goodbye"); // 现在可以安全地修改 `s` }2. 悬垂引用
返回的是一个局部变量的引用,函数作用域结束后,变量销毁
fn drip_drop() -> &String { let s = String::from("hello world!"); return &s; }修改方法:直接返回所有权
fn drip_drop() -> String { let s = String::from("hello world!"); return s; }3.借用检查器错误
v[0]返回一个引用,试图将向量中元素的引用赋值给一个所有权变量
fn main() { let s1 = String::from("hello"); let mut v = Vec::new(); v.push(s1); let s2: String = v[0]; // 试图移动元素的所有权 println!("{}", s2); }解决方法:(仅读取)
fn main() { let s1 = String::from("hello"); let mut v = Vec::new(); v.push(s1); let s2: &String = &v[0]; println!("{}", s2); }4.切片
切片(slice)是Rust中对数组、字符串等集合部分数据的引用。它具有以下核心特性:
- 引用类型:不拥有数据所有权,只是借用数据的一部分。
- 不可变和可变:支持不可变切片(&[T])和可变切片(&mut [T])。
- 高效:避免数据拷贝,直接引用原数据。
- 安全:编译时和运行时边界检查,防止越界访问和数据竞争。
(1)不可变切片
fn main() { let arr = [1, 2, 3, 4, 5]; let slice = &arr[1..4]; // 引用数组的部分数据 println!("{:?}", slice); // 输出 [2, 3, 4] }(2)可变切片
fn main() { let mut arr = [1, 2, 3, 4, 5]; let slice = &mut arr[1..3]; // 可变切片,引用数组的部分数据 slice[0] = 10; println!("{:?}", arr); // 输出 [1, 10, 3, 4, 5] }(3)字符串切片
fn main() { let s = String::from("hello, world"); let hello = &s[0..5]; // 引用字符串的部分数据 println!("{}", hello); // 输出 "hello" }(4)切片操作
fn main() { let arr = [1, 2, 3, 4, 5]; let slice = &arr[1..4]; println!("Length: {}", slice.len()); // 输出 "Length: 3" println!("First element: {:?}", slice.first()); // 输出 "First element: Some(2)" }5. 数据竞争的避免
- Rust的借用检查器在编译时强制执行借用规则,以确保在任何给定时间只有一个可变引用或多个不可变引用,从而避免数据竞争。
5. 生命周期
- Rust通过生命周期标注来确保引用的有效性,防止悬空引用。
(2)显式使用引用操作符
常见情况
-
创建引用:
- 当你需要创建一个变量的引用时,需要显式地使用 &。
let x = 5; let y = &x; // 创建对 x 的不可变引用 let z = &mut x; // 创建对 x 的可变引用(需要 x 是可变的)
-
函数参数传递引用:
- 当你定义一个函数,并希望它接收一个引用作为参数时,需要显式地使用 &。
fn print_value(value: &i32) { println!("{}", value); } let x = 10; print_value(&x); // 传递 x 的引用 -
解引用:
- 当你需要从一个引用中获取实际值时,需要显式地使用 *。
let x = 5; let y = &x; println!("{}", *y); // 解引用 y 获取 x 的值
注意和习惯
基本类型
为什么要手动设置变量可变性
- Rust支持可变和不可变变量,提供了灵活性和安全性,性能优化
- 将无需改变的变量声明为不可变,可以提升运行性能,避免多余的运行时检查。
变量命名
- 使用下划线开头的变量名,可以忽略未使用变量的警告。
- let表达式可以用于变量解构,从复杂变量中匹配出部分内容。
整形溢出处理
- Rust提供了多种方法显式处理整型溢出,如wrapping_*、checked_*、overflowing_*和saturating_*。
-
wrapping_* 方法:
- 描述:当发生溢出时,值会按照二进制补码环绕(wrap around)。这意味着溢出后的结果将从最低有效位开始重新计算。
- 用法:wrapping_add、wrapping_sub、wrapping_mul等。
- 示例:
let x: u8 = 255; let y = x.wrapping_add(1); // y == 0
- 核心:溢出后环绕,继续计算,不会引发程序错误。
-
checked_* 方法:
- 描述:当发生溢出时,返回一个None,否则返回Some(结果)。适合需要检测并处理溢出的情况。
- 用法:checked_add、checked_sub、checked_mul等。
- 示例:
let x: u8 = 255; if let Some(y) = x.checked_add(1) { // 不会执行 } else { println!("溢出检测到"); } - 核心:通过返回Option类型来检测和处理溢出。
-
overflowing_* 方法:
- 描述:返回一个包含计算结果和布尔值的元组,布尔值指示是否发生溢出。
- 用法:overflowing_add、overflowing_sub、overflowing_mul等。
- 示例:
let x: u8 = 255; let (y, overflowed) = x.overflowing_add(1); // y == 0, overflowed == true
- 核心:提供溢出后的结果,并显式指示溢出是否发生。
-
saturating_* 方法:
- 描述:当发生溢出时,值会被夹紧到类型的最大或最小值。适合需要确保结果在一定范围内的情况。
- 用法:saturating_add、saturating_sub、saturating_mul等。
- 示例:
let x: u8 = 255; let y = x.saturating_add(1); // y == 255
- 核心:溢出后结果被限制在合法范围内(最大或最小值)。
数字字面量下划线
在Rust中,数字字面量中的下划线(_)可以用于增加可读性,它们不会影响数值的实际值。
示例:1_000.000_1 表示 1000.0001。
Rust字符
Rust 的字符不仅仅是 ASCII,所有的 Unicode 值都可以作为 Rust 字符,包括单个的中文、日文、韩文、emoji 表情符号等等,都是合法的字符类型。Unicode 值的范围从 U+0000 ~ U+D7FF 和 U+E000 ~ U+10FFFF。
由于 Unicode 都是 4 个字节编码,因此字符类型也是占用 4 个字节:
单元类型()
在Rust中,单元类型 () 表示空值或空元组,通常用于函数不返回任何值的情况。尽管逻辑上是空的,但它在内存中占用的大小为0字节。使用 std::mem::size_of_val 可以确认这一点,例如 assert!(size_of_val(&unit) == 0);,这保证了 unit 的内存占用为0,体现了Rust中零大小类型(ZST)的概念和用途。
所有权
永远不会返回的函数(发散函数)
- 发散函数:返回类型为!,表示函数永远不会正常返回控制权。
- 实现方法:
- 无限循环:使用loop {}创建一个永不退出的循环。
- panic!:触发一个恐慌,使程序中止。
- std::process::exit:立即终止程序并返回指定的状态码。
// 方法一:使用无限循环 fn never_return_fn() -> ! { loop { // 无限循环,永远不会返回 } } // 方法二:调用panic! fn never_return_fn() -> ! { panic!("This function never returns!"); } // 方法三:使用std::process::exit use std::process; fn never_return_fn() -> ! { process::exit(1); // 退出程序并返回状态码1 }当所有权转移时,可变性也可以随之改变。
let x = 5; // 不可变变量 let mut y = x; // 所有权转移,y 变为可变 y += 1; // 修改 y 的值
部分移动
-
部分移动:
- 解构时可以同时移动变量的一部分,并借用另一部分。
- 被移动部分的所有权转移,原变量不能再使用该部分。
- 被借用部分仍然可以通过引用使用。
-
原变量状态:
- 整体不能再使用,因为部分所有权已转移。
- 未转移所有权的部分仍可通过引用使用。
fn main() { let t = (String::from("hello"), String::from("world")); let _s = t.0; // 仅修改下面这行代码,且不要使用 `_s` println!("{:?}", t.1); }Ref和&的区别
-
使用场景
- & 是直接引用,用于创建一个指向某个值的引用,适用于任何需要引用的地方。
- ref 主要在模式匹配中使用,用于方便地在模式匹配过程中获取某个值的引用。
-
代码简洁性和可读性
- 使用 & 创建引用时,代码逻辑清晰,直接指向某个值,易于理解。
- 使用 ref 在模式匹配中创建引用,可以使模式匹配的代码更加简洁和直观,避免了在模式匹配外部手动创建引用的繁琐。
当你在模式匹配中需要创建多个嵌套值的引用时,ref 可以大大简化代码的编写和阅读。例如:
struct Point { x: i32, y: i32, } let p = Point { x: 10, y: 20 }; match p { Point { ref x, ref y } => { // 在这里 x 和 y 都是引用 println!("x: {}, y: {}", x, y); } }在这个例子中,使用 ref 可以直接在模式匹配中创建 x 和 y 的引用。如果不使用 ref,你需要手动创建引用,这样会使代码变得更复杂:
struct Point { x: i32, y: i32, } let p = Point { x: 10, y: 20 }; let Point { x, y } = p; let x_ref = &x; let y_ref = &y; println!("x: {}, y: {}", x_ref, y_ref);借用规则
- 不可变引用与可变引用:Rust 不允许同时存在不可变引用和可变引用,以确保内存安全。
- 生命周期管理:在可变借用之前,必须完成所有对数据的不可变引用。
错误原因
- 调用 s.clear() 时存在对 s 的不可变引用 ch,违反借用规则。
修正代码
确保在修改原数据前处理完所有对数据的引用:
fn main() { let mut s = String::from("hello world"); // 获取第一个字符的不可变引用 let ch = first_character(&s); println!("the first character is: {}", ch); // 清空字符串,在使用完不可变引用之后 s.clear(); } fn first_character(s: &str) -> &str { &s[..1] }字符串
进行切片时需要注意字符边界
UTF-8 编码的字符可能占用多个字节,切片操作必须在字符边界上进行,否则程序会崩溃。
核心要点:
- UTF-8 编码:字符可能占用1至4个字节,汉字通常占3个字节。
- 字符边界:切片索引必须对齐到字符边界。
- 避免崩溃:切片时需确保索引在字符边界,否则会导致程序崩溃。
- 使用工具:可以使用 .char_indices() 方法获取字符边界,确保切片安全。
示例:
let s = "中国人"; let a = &s[0..3]; // 正确的切片,取第一个汉字 "中" println!("{}", a); // 输出 "中"String 与 &str 的转换
-
从 &str 到 String:
- String::from("hello, world")
- "hello, world".to_string()
-
从 String 到 &str:
- &s
- &s[..]
- s.as_str()
这背后的原理是 Rust 的 Deref 隐式强制转换。
不允许直接通过索引访问字符串中的字符
- 底层存储:Rust 字符串底层是字节数组 [u8]。
- UTF-8 编码:字符占用不同字节数,索引必须对齐字符边界。
- 多种表示方式:Rust 提供多种字符串表示方式,适合不同需求。
- 索引限制:为了安全和性能考虑,Rust 不允许直接索引字符串。
- 遍历字符串:使用 chars 和 bytes 方法遍历字符串,确保正确处理字符和字节。
字符串转义与原样字符串
Rust 提供了多种方法来处理字符串中的转义字符和原样字符串。以下是详细说明及核心概括。
1. 转义字符
- ASCII 转义: 使用 \x 后跟两个十六进制数来表示 ASCII 字符。
- Unicode 转义: 使用 \u 后跟花括号中的 Unicode 码点来表示 Unicode 字符。
示例代码:
fn main() { // 通过 \ + 字符的十六进制表示,转义输出一个字符 let byte_escape = "I'm writing \x52\x75\x73\x74!"; println!("What are you doing\x3F (\\x3F means ?) {}", byte_escape); // \u 可以输出一个 unicode 字符 let unicode_codepoint = "\u{211D}"; let character_name = "\"DOUBLE-STRUCK CAPITAL R\""; println!( "Unicode character {} (U+211D) is called {}", unicode_codepoint, character_name ); // 换行了也会保持之前的字符串格式 // 使用\忽略换行符 let long_string = "String literals can span multiple lines. The linebreak and indentation here ->\ println!("Value is: {}", value), None => println!("No value found"), }
高级
函数式编程
闭包捕获作用域中的值
- 闭包特性:闭包可以捕获并使用定义时作用域中的变量,而函数则不能。
- 使用场景:在需要访问定义时作用域内的变量时,闭包比函数更灵活。
- 编译器提示:Rust 编译器会友好地提示将函数替换为闭包,以便捕获动态环境中的值。
闭包对内存的影响
闭包的内存分配
- 捕获环境变量:闭包会捕获其定义时环境中的变量。
- 内存分配:捕获的变量需要额外的内存来存储。
- 性能影响:在某些场景中,这种内存分配可能成为一种负担。
函数的内存管理
- 不捕获环境变量:函数不会捕获其定义时环境中的变量。
- 无额外内存分配:因此,函数不会为环境变量分配额外的内存。
- 性能优势:避免了因内存分配带来的负担。
Fnonce转移所有权易错
- move 关键字:move 关键字将变量的所有权从其原始作用域移动到闭包的作用域中。
- 捕获行为:对于 Copy 类型(如 i32),闭包捕获的是变量的一个副本,而不是引用。
- 副本的生命周期:闭包持有的副本在整个闭包生命周期内是唯一的,不会每次调用闭包时重新复制原始值。
- 闭包内的修改:每次调用闭包时,闭包内部的 count 副本都会递增,而外部的 count 保持不变。
示例代码:
fn main() { let mut count = 0; // 闭包 `inc` 使用 `move` 捕获了 `count` 的所有权 // 由于 `count` 是一个 `i32` 类型,实现了 `Copy` trait, // 因此捕获的是 `count` 的一个副本,但这个副本在闭包的整个生命周期内是唯一的 let mut inc = move || { count += 1; // 修改的是闭包内的 `count` 副本,每次调用闭包时,这个副本都会递增 println!("`count`: {}", count); // 打印副本的值 }; inc(); // 调用闭包,闭包内的 `count` 变为 1 // 尝试不可变借用原始的 `count` // 因为闭包捕获的是副本,原始的 `count` 仍然存在且未被借用 let _reborrow = &count; inc(); // 再次调用闭包,闭包内的 `count` 副本变为 2 // 尝试可变借用原始的 `count` // 由于闭包捕获的是副本,原始的 `count` 仍然存在且未被借用 let _count_reborrowed = &mut count; // 断言外部的 `count` 仍然为 0 // 因为闭包内部修改的是副本,外部的 `count` 未被修改 assert_eq!(count, 0); }
- 调用 s.clear() 时存在对 s 的不可变引用 ch,违反借用规则。
-
- Rust通过生命周期标注来确保引用的有效性,防止悬空引用。
-
-
-
-
-
-
-
-
-
- 三元表达式:
- 声明函数:
- 迭代器循环:
- 动态数组(向量):
- 声明变量:

