Java Stream流

MOOC 个人学习笔记

# 1. 流的概述

a sequence of elements from source that supports aggregate operations

sequence of elements: 一个流对外提供一个接口，可以访问到一串特定的数据。流不存储元素，但是可以根据需要进行计算转化
source：数据来源，如数据结构，数组，文件等
aggregate operation：聚合操作，流支持像 SQL 操作或者其他函数式语言的操作，如 filter/map/reduce/find/match/sorted 等
pipelining: 很多流操作也是返回一个流
Internal Iteration: 流操作进行迭代，用户感知不到循环遍历

# Stream 语法

类似 SQL 语句，遵循 “做什么而非怎么做” 原则

# 流的工作流程

流的创建
流的转换，将流转换为其他流的中间操作，可包括多个步骤 (惰性操作)
流的计算结果。这个操作会强制执行之前的惰性操作。这个步骤以后，流就再也不用了

# 2. 流的创建

Collection 接口的 stream 方法

	Stream<String> a1 = new ArrayList<String>().stream();
	Stream<String> a2 = new HashSet<String>().stream();

还有其他的子类，如 LinkedList, LinkedSet, TreeSet, Vector 等

Arrays.stream 可以将数组转为 Stream

Stream<String> b1 = Arrays.stream("a,b,c,d,e".split(","), 3, 5);

利用 Stream 类进行转化

of 方法，直接将数组转化

	Stream<Integer> c1 = Stream.of(new Integer[5]);
	Stream<String> c2 = Stream.of("a,b,c".split(","));
	Stream<String> c3 = Stream.of("a", "b", "c");

empty 方法，产生一个空流

Stream<String> d1 = Stream.empty();

利用 Stream 类进行转化

generate 方法，接收一个 Lambda 表达式

	Stream<String> e1 = Stream.generate(()->"hello");
	Stream<Double> e2 = Stream.generate(Math::random);

iterate 方法，接收一个种子，和一个 Lambda 表达式

Stream<BigInteger> e3 = Stream.iterate(BigInteger.ZERO, n -> n.add(BigInteger.ONE));

其他类 / 方法产生 Stream 流

Files.lines 方法

Stream<String> contents = Files.lines(Paths.get("C:/abc.txt"));

Pattern 的 splitAsStream 方法

Stream<String> words = Pattern.compile(",").splitAsStream("a,b,c");

# 基本类型流

IntStream，LongStream，DoubleStream

	IntStream s1 = IntStream.of(1,2,3,4,5);

	s1 = Arrays.stream(new int[] {1,2,3});
	s1 = IntStream.generate(()->(int)(Math.random() * 100));
	s1 = IntStream.range(1,5); //1,2,3,4 step 1
	s1 = IntStream.rangeClosed(1,5); //1,2,3,4,5

	IntStream s2 = IntStream.of(1,2,3,4,5);
	Stream<Integer> s3 = s2.boxed();
	IntStream s5 = s3.mapToInt(Integer::intValue);

# 并行流

使得所有的中间转换操作都将被并行化
Collections.parallelStream () 将任何集合转为并行流
Stream.parallel () 方法，产生一个并行流

	IntStream s1 = IntStream.range(1,10000000);
	long evenNum = s1.parallel().filter(n->n%2==0).count();
	System.out.println(evenNum);

注意：需要保证传给并行流的操作不存在竞争

# 3.Stream 的转换

# 过滤 filter

filter(Predicate<? super T> predicate)
接收一个 Lambda 表达式，对每个元素进行判定，符合条件留下

	Stream<Integer> s1 = Stream.of(1, 2, 3, 4, 5);
	Stream<Integer> s2 = s1.filter(n -> n>2);
	s2.forEach(System.out::println);
	//3, 4, 5

# 去重 distinct

distinct()
对流的元素进行过滤，去除重复，只留下不重复的元素

	// 基本类型包装类对象去重
	Stream<Integer> s1 = Stream.of(1, 1, 2, 2, 3, 3);
	Stream<Integer> s2 = s1.distinct();
	s2.forEach(System.out::println);
	// 1, 2, 3

	// 自定义对象的去重
	ArrayList<Student> students = new ArrayList<Student>();
	students.add(new Student("Tom", 20));
	students.add(new Student("Tom", 20));
	students.add(new Student("Jerry", 20));
	students.add(new Student("Jerry", 18));

	// 先对象的 hashCode 再调用 equals 方法进行判重
	Stream<Student> s3 = students.stream().distinct();
	s3.forEach(System.out::println);

# 排序 sorted

sorted()
对流的基本类型包装类元素进行排序

	Stream<Integer> s1 = Stream.of(3,2,4,1,5);
	Stream<Integer> s2 = s1.sorted();
	s2.forEach(System.out::println);
	//1, 2, 3, 4, 5

提供 Comparator，对流的元素进行排序

	String[] planets = new String[] {
	"Mercury", "Venus", "Earth",
	"Mars", "Jupiter", "Saturn",
	"Uranus", "Neptune" };

	Stream<String> s3 = Stream.of(planets).sorted(
	Comparator.comparing(String::length));
	s3.forEach(System.out::println);

对流的自定义对象元素进行排序，调用对象的 compareTo 方法

	ArrayList<Cat> cats = new ArrayList<>();
	cats.add(new Cat(3));
	cats.add(new Cat(2));
	cats.add(new Cat(5));
	cats.add(new Cat(1));
	cats.add(new Cat(4));
	Stream<Cat> s4 = cats.stream().sorted();
	s4.forEach(System.out::println);

# 转化 map

利用方法引用对流每个元素进行函数计算

	Stream<Double> s1 = Stream.of(-1.5, 2.5, -3.5);
	Stream<Double> s2 = s1.map(Math::abs);
	s2.forEach(System.out::println);

利用 Lambda 表达式对流每个元素进行函数计算

	Stream<Integer> s3 = Stream.of(1,2,3,4,5);
	Stream<Integer> s4 = s3.map(n->n*n);
	s4.forEach(System.out::println);

利用方法引用，对流每个元素进行函数计算返回 Stream

	String[] planets = new String[] {
	"Mercury", "Venus", "Earth"};

	Stream<String> allLetters2 =
	Stream.of(planets).flatMap(word -> letters(word));
	allLetters2.forEach(System.out::print);
	//flatMap 执行一对多的转换，然后将所有的 Map 都展开
	//['M','e','r','c','u','r','y',
	// 'V','e','n','u','s',
	// 'E','a','r','t','h']

	public static Stream<String> letters(String word)
	{
	List<String> result = new ArrayList<>();
	for(int i=0;i<word.length();i++)
	{
	result.add(word.substring(i, i+1));
	}
	return result.stream();
	}

利用方法引用，对流每个元素进行函数计算返回 Stream，并合并

	Stream<Stream<String>> allLetters =
	Stream.of(planets).map(word -> letters(word));
	allLetters.forEach(System.out::print);
	//[['M','e','r','c','u','r','y'],
	// ['V','e','n','u','s'],
	// ['E','a','r','t','h']]

# 抽取 limit

	// 获取前 n 个元素
	Stream<Integer> s1 = Stream.of(1,2,3,4,5,6,7,8,9,10);
	Stream<Integer> s2 = s1.limit(3);
	s2.forEach(System.out::println);

# 跳过 skip

	// 跳过前 n 个元素
	Stream<Integer> s3 = Stream.of(1,2,3,4,5,6,7,8,9,10);
	Stream<Integer> s4 = s3.skip(8);
	s4.forEach(System.out::println);

# 连接 concat

//连接两个流
Stream<String> s5 = Stream.concat(letters("hello"), letters("world"));
s5.forEach(System.out::println);

# 额外调试 peek

	Stream<Double> s1 = Stream.iterate(1.0, n -> n*2)
	.peek(n -> System.out.println("number:" + n)).limit(5);
	s1.forEach(System.out::println);

# 4.Optional 类型

一个包装器对象
要么包装了类型 T 的对象，要么没有包装任何对象 (还是 null)
如果 T 有值，那么直接返回 T 的对象
如果 T 是 null，那么可以返回一个替代物

	Optional<String> s1 = Optional.of(new String("abc"));
	String s2 = s1.get();
	System.out.println("s2: " + s2); //abc

	Optional<String> s3 = Optional.empty();
	String s4 = s3.orElse("def");
	System.out.println("s4: " + s4); //def

# Optional<T> 创建

of 方法
empty 方法
ofNullable 方法，对于对象有可能为 null 情况下，安全创建

	Optional<String> s5 = Optional.of(new String("abc"));
	Optional<String> s6 = Optional.empty();
	String s7 = null;
	Optional<String> s8 = Optional.ofNullable(s7);
	//s7 不为 Null，s8 就是 s7, 否则 s8 就为 Optional.empty ()

# Optional<T> 使用

get 方法，获取值，不安全的用法
orElse 方法，获取值，如果为 null，采用替代物的值
orElseGet 方法，获取值，如果为 null，采用 Lambda 表达式值返回
orElseThrow 方法，获取值，如果为 null，抛出异常
ifPresent 方法，判断是否为空，不为空返回 true
isPresent (Consumer), 判断是否为空，如果不为空，则进行后续 Consumer 操作，如果为空，则不做任何事情
map (Function), 将值传递给 Function 函数进行计算。如果为空，则不计算

# Optional<T> 注意事项

直接使用 get，很容易引发 NoSuchElementException 异常
使用 isPresent 判断值是否存在，这和判断 null 是一样的低效

# 5. 流的计算结果

# 简单约简 (聚合函数)

count (), 计数

	Stream<Integer> s1 = Stream.of(a);
	long countResult = s1.filter(n-> n>0).count();

max (Comparator)，最大值，需要比较器

	Stream<Integer> s2 = Stream.of(a);
	Optional<Integer> maxResult = s2.max((n1,n2)->n1-n2);

min (Comparator)，最小值，需要比较器

	Stream<Integer> s3 = Stream.of(a);
	Optional<Integer> minResult = s3.min((n1,n2)->n1-n2);

findFirst (), 找到第一个元素

	Stream<Integer> s4 = Stream.of(a);
	Optional<Integer> first = s4.findFirst();

findAny (), 找到任意一个元素

	Stream<Integer> s5 = Stream.of(a);
	Optional<Integer> random = s5.findAny();

anyMatch (Predicate)，如有任意一个元素满足 Predicate，返回 true

	Stream<Integer> s6 = Stream.of(a);
	System.out.println(s6.anyMatch(n -> n>6));

allMatch (Predicate)，如所有元素满足 Predicate，返回 true

	Stream<Integer> s7 = Stream.of(a);
	System.out.println(s7.allMatch(n -> n>6));

noneMatch (Predicate)，如没有任何元素满足 Predicate，返回 true

	Stream<Integer> s8 = Stream.of(a);
	System.out.println(s8.noneMatch(n->n>100));

# 自定义约简

reduce，传递一个二元函数 BinaryOperator，对流元素进行计算
如求和、求积、字符串连接等

	Integer[] a = new Integer[] {2,4,6,8};

	Stream<Integer> s1 = Stream.of(a);
	Optional<Integer> sum = s1.reduce(Integer::sum);
	System.out.println(sum.get());

	Stream<Integer> s2 = Stream.of(a);
	Optional<Integer> product = s2.reduce((x,y)->x*y);
	System.out.println(product.get());

	Stream<Integer> s3 = Stream.of(a);
	Integer product3 = s3.reduce(1,(x,y)->x*y);
	System.out.println(product3);

	String[] b = new String[] {"abc","def","ghi"};
	Stream<String> s4 = Stream.of(b);
	String bigStr = s4.reduce("",(x,y)->x+y);
	System.out.println(bigStr);

# 查看 / 遍历元素

iterator ()，遍历元素
forEach (Consumer)，应用一个函数到每个元素上

	Integer[] a = new Integer[] {2,4,6,8};

	Stream<Integer> s1 = Stream.of(a);
	Iterator<Integer> it1 = s1.filter(n->n>2).iterator();
	while(it1.hasNext()) {
	System.out.println(it1.next());
	}

	Stream<Integer> s2 = Stream.of(a);
	s2.filter(n->n>2).forEach(System.out::println);

# 存放到数据结构中

toArray ()，将结果转为数组
collect (Collectors.toList ()), 将结果转为 List

	//List
	Stream<Integer> s1 = Stream.of(a);
	List<Integer> list1 = s1.collect(Collectors.toList());

	//Linkedlist
	Stream<Integer> s2 = Stream.of(a);
	List<Integer> list2 = s2.collect(Collectors.toCollection(LinkedList::new));

collect (Collectors.toSet ()), 将结果转为 Set

	Stream<Integer> s3 = Stream.of(a);
	Set<Integer> set1 = s3.collect(Collectors.toSet());

collect (Collectors.toMap ()), 将结果转为 Map

	List<Person> persons = new ArrayList<Person>();
	persons.add(new Person(1, "Jerry"));
	persons.add(new Person(2, "Tom"));

	// 将流存储为 Map
	Stream<Person> s6 = persons.stream();
	Map<Integer, String> map1 = s6.collect(Collectors.toMap(Person::getId, Person::getName));

collect (Collectors.joining ()), 将结果连接起来

	// 将流变换为字符流，并连接起来
	Stream<Integer> s4 = Stream.of(a);
	String result = s4.map(String::valueOf).collect(Collectors.joining());
	System.out.println(result); //2468

	// 将流变换为字符流，并连接起来
	Stream<Integer> s5 = Stream.of(a);
	String result2 = s5.map(String::valueOf).collect(Collectors.joining(","));
	System.out.println(result2); //2,4,6,8

# 流的高阶计算

分组 groupingBy 和分区 partitionBy
分组后的约简
- counting
- summing
- maxBy
- minBy
以上方法均在 java.util.stream.Collectors 中

# 6. 流的应用

# Java Stream 的优点

统一转换元素
过滤元素
利用单个操作合并元素
将元素序列存放到某一个集合中
搜索满足某些条件的元素的序列
类似 SQL 操作，遵循 “做什么而非怎么做” 原则
简化了串行 / 并行的大批量操作

# Java Stream vs 循环迭代代码

Stream 广泛使用 Lambda 表达式，只能读取外围的 final 或者 effectively final 变量，循环迭代代码可以读取 / 修改任意的局部变量。
在循环迭代代码块中，可以随意 break/continue/return，或者抛出异常，而 Lambda 表达式无法完成这些事情。
Stream 流不是淘汰循环迭代代码，应该是两者相互搭配使用

# Stream 应用注意事项

一个流，一次只能一个用途，不能多个用途，用了不能再用
避免创建无限流
注意操作顺序
谨慎使用并行流
- 底层使用 Fork-Join Pool，处理计算密集型任务
- 数据量过小不用
- 数据结构不容易分解的时候不用，如 LinkedList 等 –数据频繁拆箱装箱不用
- 涉及 findFirst 或者 limit 的时候不用

# Stream vs Collection

Stream 和 Collection 两者可以互相转化
如果数据可能无限，用 Stream
如果数据很大很大，用 Stream
如果调用者将使用查找 / 过滤 / 聚合等操作，用 Stream
当调用者使用过程中，发生数据改变，而调用者需要对数据一致性有较高要求，用 Collection

Java

# 1. 流的概述

# Stream 语法

# 流的工作流程

# 2. 流的创建

# 基本类型流

# 并行流

# 3.Stream 的转换

# 过滤 filter

# 去重 distinct

# 排序 sorted

# 转化 map

# 抽取 limit

# 跳过 skip

# 连接 concat

# 额外调试 peek

# 4.Optional 类型

# Optional<T> 创建

# Optional<T> 使用

# Optional<T> 注意事项

# 5. 流的计算结果

# 简单约简 (聚合函数)

# 自定义约简

# 查看 / 遍历元素

# 存放到数据结构中

# 流的高阶计算

# 6. 流的应用

# Java Stream 的优点

# Java Stream vs 循环迭代代码

# Stream 应用注意事项

# Stream vs Collection

Java Lambda表达式

Java 模块化