Large Language Models

AI Safety Diary: September 11, 2025

A diary entry covering AI personalities, utility engineering for emergent value systems, and methods for evaluating the goal-directedness of Large Language Models (LLMs).

AI Safety Diary: August 12, 2025

A diary entry summarizing several introductory resources on how AI learns, including machine learning concepts, Large Language Models (LLMs), and the progress of the deep learning revolution.