Home avatar

Wenqian's Blog

博物学会

意义问题的重新审视(GPT版)

你现在的状态可以从 “快感刺激与价值追求” 的角度来理解,本质上是一种短期逃避和长期意义之间的拉扯

你的描述让我想到一个核心问题:如何区分真实的志趣与外部塑造的志趣? 以及,如何建立一种能让自己内在满足的评价体系,而不是依赖外部认可?

2024 年终总结补档

自己之前其实非常在意意义这个问题,而且这似乎是自己取得良好生活的突破口。在最近重新去读安小庆《平原上的娜拉​》那篇文章后,很突然有一个体悟是意义几乎无法取得;时间是无穷无尽的,既然人类已然放弃了亡者世界的幻想,那么意义永远无法在人活着的时候得到,也无法在人死后验证。那么每一个有意识的生灵应该如何自处呢,或许是像刘小样那样,对自己的生命保有好奇心(无论是否意识到自己的好奇心这一点)?但是即便意识到这一点又如何呢?我们似乎始终无法对我们应该产生兴趣的东西永远热忱下去。而最近读到的一些其他关于哲学的东西恍惚间给我提供一些可能的答案。在此之前我一直认为冥想比思辨更重要,但我才发现这只是自己的怠惰所导致的。人既然处在一张大的社会关系网络中,那么就不可避免的会受到其中的影响。所以我们的志趣中既有本真的部分,也有被社会塑造的部分。那又如何能够抛开过去的思想和当下的环境对我们生活和自我的影响呢?那么首要的事是,厘清那些思想的部分,理清我们的理解,理清我们的志趣是如何形成。所以,我现在渐渐要做的是不要羞于承认黑塞的找到自我的价值没有那么大,当下便是要读得更多,即便没有解决方案我也要知道何以至此的。

强化学习中的 TD 方法

时序差分方法 (TD) 结合 Sample 和 Bootstrapping

时序差分 (Temporal-Difference, TD) 方法结合了强化学习中的两大关键思想: Sample Updates 和 Bootstrapping.它融合了蒙特卡罗方法 (MC) 的优势和动态规划 (DP) 的特点.我们分别从这两个概念出发, 详细说明 TD 方法是如何同时结合它们的.

HuggingFace 学习笔记

这部分的文档主要用作记录学习, 使用 HF 的时候常用的一些操作, 可能并不会很详细, 以及符合初学者的需求, 但是可以当做 CheatSheet 一类文档使用.

管道的使用

整体流程: 以情感分析为例

首先, 从 transformers 中导入 tokenizer, 主要将文本转成模型可以识别的 token:

0%