23/02/2026
[VỀ SHOW DON’T TELL, ĐIỆN ẢNH, HÌNH ẢNH, VÀ NGÔN NGỮ]
Thấy chị em bạn bè đều lên bài về ngôn ngữ điện ảnh, rồi “show don't tell” ctct, thôi thì bọn mình cũng góp vui, cho mọi người thêm một góc nhìn. Bài dài.
1. THỨ NHẤT, "SHOW DON'T TELL" HAY "TELL DON'T SHOW"…
…không phải là câu hỏi nên được đặt ra, đặc biệt là với mấy khẳng định dạng nhị nguyên như này. Việc lựa chọn một trong hai, coi một cái là chân lý phổ quát và loại trừ cái còn lại, hay chụp mũ theo kiểu số lượng cảnh “show” nhiều hơn thì phim mặc nhiên hay hơn, giống như kiểu tách một đấu gạo với một đấu thóc đã được trộn lẫn với nhau, hay cố gắng giải một bài toán không có nghiệm vậy. Làm thì vẫn làm được, nhưng làm làm gì, tốn công vô ích. Nguồn gốc của "show don't tell" không phải là từ điện ảnh, mà là từ văn học. Việc chuyển vị khẳng định này từ văn học sang điện ảnh mà không chú ý đến những đặc trưng về thuộc tính vật chất của điện ảnh thì cũng vứt đi. "Show don't tell" nếu như nhấc ra khỏi ngữ cảnh, chỉ nhấn mạnh rằng điện ảnh trước tiên là hình thức nghệ thuật của hình ảnh, hay cụ thể hơn là sự vận động của hình ảnh. Thế nên, thay vì cố gắng chộp giật chọn cái này bỏ cái kia, ở góc độ thực hành, chúng ta nên nhìn “show” và “tell” theo hướng công cụ: tức là chúng vừa được xây dựng trên một nền tảng biểu nghĩa nhất định, vừa được sử dụng như những chiến lược biểu nghĩa để hướng đến một mục đích biểu nghĩa nhất định.
Đạo diễn Michael Roemer (cụ mới mất năm ngoái), trong tiểu luận The Surfaces of Reality (1964), đưa ra một cách phân loại hữu dụng hơn. Roemer phân biệt giữa trích dẫn (citing) của điện ảnh gà mờ và kết xuất (rendering) của điện ảnh xịn. Trích dẫn là khi một bộ phim dùng các quy tắc và tập quán đã được thiết lập sẵn: cử chỉ diễn xuất, lời thoại thông báo cảm xúc (tệ hơn là volume của lời thoại tỉ lệ thuận với cường độ của cảm xúc), hay tình huống kịch tính được sắp xếp theo công thức, v.v. nhằm kích hoạt phản ứng cảm xúc của khán giả mà không cần thực sự tạo ra một trải nghiệm. Khán giả không “trải nghiệm” cái gì cả. Họ chỉ được thông báo rằng họ nên cảm thấy gì đó một cách hoàn toàn bị động, và họ ngoan ngoãn làm theo vì đã bị điều kiện hóa bởi hàng nghìn giờ xem phim trước đó. Ngược lại, kết xuất là khi nhà làm phim tạo ra một tình huống đủ cụ thể, đủ tính vật lý, đủ khách quan đến mức khán giả phải tự xử lý nó theo cách họ xử lý các tình huống trong đời sống thực. Khán giả chủ động tham dự vào trải nghiệm điện ảnh, qua đó hoàn thiện quá trình tạo nghĩa, rồi chiêm nghiệm và rút ra kết luận sau cuối. Hãy xem cách mà Ken Loach mô tả năng lực sử dụng máy tính của Daniel Blake - một nhân vật lớn tuổi, xuất thân từ tầng lớp lao động trong I, Daniel Blake (2016), qua cả dàn cảnh, bố cục khung hình, điệu bộ, cử chỉ hay lời nói. Không khán giả nào được thông báo rằng hệ thống phúc lợi đang vô cảm với những thân phận bên lề xã hội cả, mà họ được “đặt” vào trong sự vô cảm đó qua sự vụng về của Daniel với các thao tác trên máy tính.
Thế nên, thay vì hiểu "show don't tell" theo kiểu cho nhân vật nhìn ra cửa sổ mưa tầm tã thay vì để nhân vật nói "tôi buồn thối ruột gan" một cách trừu tượng; chúng ta bắt buộc phải đặt cả “show” và “tell” vào trong một vùng diễn giải nhất định, và xem chúng đóng vai trò gì trong chiến lược biểu nghĩa [của bộ phim]. Đây là một trong những sự khác biệt căn bản giữa ngôn ngữ điện ảnh và ngôn ngữ giao tiếp, và là hạn chế của việc nhìn ngôn ngữ điện ảnh như một cú pháp biểu nghĩa của ngôn ngữ giao tiếp. Ngôn ngữ giao tiếp có thể thay đổi lựa chọn về từ nhưng hệ thống vẫn vận hành (ví dụ: trong trục lựa chọn/paradigmatic, các bạn thử thay từ “sầu thảm” bằng “u uất” trong một câu nói về nỗi buồn chẳng hạn). Tương tự, ở tầng ngôn ngữ, các đặc tính vật chất của từ như kích cỡ chữ, chất liệu giấy, hay độ to nhỏ của âm thanh, về nguyên tắc, không mang nghĩa (một chữ A viết tay hay in máy, hoặc một chữ A được phát âm to hay nhỏ vẫn là cùng một ký hiệu). Nhưng ngôn ngữ nghệ thuật, trong trường hợp này là điện ảnh, thì hoàn toàn khác; vì không có ranh giới rõ ràng giữa các đơn vị biểu nghĩa, và các đặc tính vật chất của điện ảnh thì đều có thể mang nghĩa (ví dụ: grain trong Dancer in the Dark hay The Battle of Algiers, nhịp dựng trong Man with a Movie Camera, ống kính góc rộng trong I Am Cuba) [1]. Một điểm trong không-thời gian của một bộ phim đều có quan hệ với mọi điểm khác, và không có cách nào cô lập một điểm và xét nghĩa của chúng mà không liên hệ với tổng thể.
Tất nhiên, cách phân biệt của Roemer có hạn chế* mà bọn mình sẽ diễn giải ở phần sau.
2. THỨ HAI, VỀ NGÔN NGỮ ĐIỆN ẢNH,
Điện ảnh là một môn nghệ thuật. Và cũng như các môn nghệ thuật khác, điện ảnh có một hệ thống ngôn ngữ biểu nghĩa khu biệt nó với các loại hình khác. Điện ảnh là một môn nghệ thuật được trải nghiệm trong thời gian, và ngôn ngữ của nó có thời tính. Điều này được thể hiện qua dựng phim, hay qua việc sắp xếp các đơn vị biểu nghĩa trong dòng thời gian theo một trật tự nhất định, nhằm tạo ra sự vận động của hình ảnh qua thời gian (ví dụ: lý thuyết Soviet montage từ nhóm VGIK của Eisenstein hay Pudovkin). Tương tự, điện ảnh là một môn nghệ thuật được trải nghiệm trong không gian, và ngôn ngữ của nó cũng mang tính không gian. Điều này được thể hiện qua dàn cảnh (ví dụ: blocking, ánh sáng, trang phục, diễn xuất), qua bố cục khung hình, qua ngôn ngữ của ống kính (ví dụ: cỡ cảnh, góc máy, chuyển động máy, tốc độ màn trập), v.v.
Không phải là nhà lý thuyết điện ảnh, nhưng nhà phê bình nghệ thuật nổi tiếng Erwin Panofsky lại có hai quan sát rất thú vị về điện ảnh. Đầu tiên, Panofsky khẳng định điện ảnh là môn nghệ thuật duy nhất có thể động hóa không gian và không gian hóa thời gian. Không gian trong điện ảnh không phải là không gian tĩnh. Máy quay chuyển động, cắt cảnh thay đổi không gian, v.v. cho thấy không gian có thể bị nhào nặn, kéo giãn hay nén lại. Tương tự, thời gian trong điện ảnh cũng có thể được sắp xếp bằng các thủ pháp như flashback hay dựng song song, vốn biến thời gian thành một không gian có thể được định hình và điều hướng [2]. Thứ hai, Panofsky chỉ ra điện ảnh khác biệt với những hình thức nghệ thuật đi trước như điêu khắc, kiến trúc, hay hội họa, ở điểm nó phong cách hóa thực tại (tức là bắt đầu từ thực tại thô rồi tìm cách tổ chức và định hình thực tại đó qua các thủ pháp cụ thể), thay vì thực tại hóa phong cách (tức là áp đặt một tinh thần thẩm mỹ lên một tổ hợp tài nguyên và chất liệu thô trong thực tại) [3]. Tức là, ở góc độ bản thể, điện ảnh khởi phát trong thực tại, chứ không phải được tạo tác từ nguyên liệu thô trong thực tại**.
Có hai kênh ngôn ngữ để điện ảnh trình hiện: đó là kênh hình ảnh và kênh âm thanh (tính từ thời điện ảnh có tiếng). Cần lưu ý rằng, mối quan hệ giữa hai kênh này không đơn giản là song song hay bổ trợ nhau; dù chúng ta vẫn thường quan niệm hình ảnh là chính, còn âm thanh chỉ là thứ yếu. Khi bước vào một trải nghiệm điện ảnh, người xem ký vào một “hợp đồng tri giác”, trong đó hình ảnh và âm thanh không tồn tại độc lập mà liên tục đối thoại và tái định nghĩa lẫn nhau. Tất cả những đặc trưng kể trên chỉ đang đề cập đến sự hiện diện, có mặt. Sự vắng mặt, khuyết thiếu cũng đóng vai trò quan trọng nhằm biểu thị cho ngôn ngữ điện ảnh (điện ảnh của Robert Bresson là một ví dụ), nhưng bọn mình sẽ không đi sâu vào phần này.
Tất nhiên, giới hạn tập quán ở đây là điện ảnh chủ lưu, điện ảnh tự sự. Ngược lại, những nhà làm phim thể nghiệm, phim cấu trúc cần được trải nghiệm theo một hướng khác. Stan Brakhage tác động trực tiếp lên phim âm bản: vẽ, cào xước, dánh cánh bướm và lá cây [lên phim âm bản]. Gregory Markopoulos phá vỡ các tập quán phổ thông về mã điện ảnh và buộc người xem phải trải nghiệm một nhịp điệu phi tự sự, cùng một cách đọc kháng lại biểu nghĩa tập quán. Họ là những người hoặc đứng ở đường biên, hoặc đứng ngoài vùng quy phạm của ngôn ngữ điện ảnh truyền thống. Sự tồn tại của họ đặt ra một câu hỏi căn bản: nếu điện ảnh có thể vận hành mà không cần hình ảnh chuyển động liên tục, không cần tường thuật, không cần bất kỳ tập quán nào của điện ảnh chủ lưu, thì những tập quán đó là gì: là bản chất của phương tiện hay chỉ là lịch sử của phương tiện?
Cái mà giới phê bình gọi là specificity thesis, tức là giả định mỗi phương tiện nghệ thuật có bản chất vật chất và hình thức đặc thù, và từ bản chất đó có thể suy ra những khả năng biểu đạt khu biệt và mang tính quy phạm, đã bị tấn công dữ dội trong phê bình điện ảnh đương đại. Tất nhiên, specificity thesis vẫn mang một sức nặng đáng kể trong không gian điện ảnh chủ lưu; bằng chứng là chúng ta vẫn dùng nó mỗi khi thảo luận về điện ảnh***. Còn lại, điều cần nhớ là ngôn ngữ điện ảnh truyền thống có tính tập quán: chúng được xây dựng qua lịch sử, qua thực hành, qua điều kiện hóa, chứ không phải qua yếu tính của phương tiện. Specificity thesis vận hành khi sự phân biệt đó bị bỏ qua, khi tập quán được đọc như yếu tính.
Một phê phán đến từ hướng khác, nhắm vào chính công cụ phân tích mà nhiều người sử dụng để đọc điện ảnh: ký hiệu học. Stephen Prince trong tiểu luận The Discourse of Pictures: Iconicity and Film Studies (1993) chỉ ra rằng truyền thống ký hiệu học điện ảnh, từ Metz trở đi (và sau này là Eco), đã áp đặt lên hình ảnh điện ảnh một mô hình ký hiệu của de Saussure vốn được xây dựng cho ngôn ngữ giao tiếp, nơi ký hiệu chỉ mang tính tập quán, trong khi hình ảnh điện ảnh về bản chất là hình tượng (iconic) và chỉ hiệu (indexical): nó không chỉ đại diện cho thực tại mà còn xuất phát từ thực tại vật chất (có thể liên hệ tới Bazin). Như bọn mình đã đề cập ở phần một, đây là một giới hạn cần chú ý khi đọc điện ảnh qua lăng kính ký hiệu học: theo kiểu góc quay A sẽ chỉ biểu thị một ý nghĩa X, hay chi tiết B sẽ chỉ báo hiệu một vùng diễn giải Y [4].
Hai phê phán về specificity thesis (nhắm vào tính quy phạm) và về việc đọc điện ảnh như ký hiệu (nhắm vào công cụ phân tích), không phủ nhận rằng điện ảnh có ngôn ngữ. Chúng chỉ nhắc nhở rằng ngôn ngữ đó phức tạp hơn bất kỳ một hệ thống lý thuyết nào có thể bao trọn. Điều này đặc biệt quan trọng khi ta đối mặt với một khái niệm như "show don't tell" - một quy tắc rất hay được nhấc ra khỏi ngữ cảnh và nguồn gốc văn học của nó (Wikipedia không tính phí :v). "Show don't tell" có thể là sự đúc kết một trực giác thực hành mang tính quy phạm, nhưng nếu sử dụng như một chân lý tuyệt đối nhằm bác bỏ phản đề của nó thì hoàn toàn không ổn.
Về mặt bản thể, từ Panofsky và Prince, có thể thấy hình ảnh điện ảnh không chỉ đại diện cho thực tại mà còn có dấu vết vật chất của thực tại trong chính nó - một quan hệ mà ngôn ngữ giao tiếp không có. Chính vì vậy, “show” trong điện ảnh không phải là một chiến lược biểu nghĩa, nó là điều kiện bản thể của hình ảnh. Ở góc độ bản thể (phần một là từ góc độ công cụ/thực hành), nói "show don't tell" như thể đó là lựa chọn phong cách là đã hiểu sai bản chất của hình ảnh điện ảnh ngay từ đầu. Nếu điện ảnh chủ lưu vận hành qua cả kênh hình ảnh lẫn kênh âm thanh, và nếu hai kênh đó không ngừng tương tác với nhau, thì “show” và “tell” không phải là hai cực đối lập mà là hai mặt của cùng một chỉnh thể. Do đó, việc chắp nối vụng về “show” vào hình ảnh và "tell" vào âm thanh, vào lời thoại như thể đó là bản chất của điện ảnh là một khẳng định vừa lười biếng, vừa sai lầm.
3. THỨ BA, DÙNG "SHOW DON'T TELL" HOẶC "TELL DON'T SHOW" ĐỂ CHE ĐẬY, HOẶC ĐÁNH LẠC HƯỚNG THẢO LUẬN,
Đây là một cái bọn mình thấy khá buồn cười, bởi nó đã đánh lạc hướng hoàn toàn cuộc thảo luận về một bộ phim hay hay dở. Cơ chế của nó thường diễn ra như sau: thay vì đối mặt với một phê bình cụ thể về kịch bản, về dàn cảnh, hay về cách bộ phim xử lý chủ đề của mình, người ta ném "show don't tell" hay "tell don't show" vào như một lá chắn để bác bỏ mọi phê bình, thay vì như một công cụ phân tích. Kết quả là cuộc thảo luận dịch chuyển khỏi bộ phim cụ thể và trôi vào một cuộc tranh luận về định nghĩa, về tập quán, về quy tắc, về ai đang áp dụng quy tắc chuẩn mực hơn, tài tình hơn. Bộ phim…biến mất. Chỉ còn lại khái niệm bị nhấc ra khỏi ngữ cảnh.
Tương tự là việc phân cấp điện ảnh thành các tầng như hàn lâm hay đại chúng; rồi từ đó suy ra rằng điện ảnh đại chúng không cần, hay không nên, đặt ra các yêu cầu cao hơn về mặt nội dung, hình thức hay tư tưởng. Đây là một sự đánh lận con đen khá…cục mịch, vì nó biến một phân loại có tính mô tả thành một phán quyết mang tính quy phạm. Lập luận này nghe có vẻ “thực tế”, nhưng thực chất nó đang hạ thấp cả nhà làm phim lẫn khán giả phổ thông. Nó giả định rằng khán giả phổ thông không xứng đáng được trải nghiệm điện ảnh chất lượng, và rằng điện ảnh chất lượng là đặc quyền của một không gian tinh hoa nào đó tách biệt hoàn toàn khỏi thị trường điện ảnh đại chúng - vốn hướng đến tệp khán giả phổ thông. Chúng ta ai cũng có thể lấy ví dụ về các đạo diễn hoạt động ở không gian điện ảnh đại chúng, hoặc làm phim dành cho đại chúng, nhưng vẫn có thể tạo nên các tác phẩm chất lượng: Howard Hawks, Akira Kurosawa, John Carpenter, Brian De Palma, Christopher Nolan, v.v. Bản thân Oscars của Viện Hàn lâm Khoa học Mỹ cũng là một thiết chế công nhận và điển phạm hóa điện ảnh đại chúng Mỹ, vốn thường bị nhầm lẫn như là tòa án tối cao của Điện-ảnh-viết-hoa. Tất nhiên, những so sánh về các tác phẩm từng giành Oscar, ví dụ như Anora, với filmography của đạo diễn X thì quả thực là quá khập khiễng.
Again, vấn đề không phải ở bản thân các khái niệm hay các cách phân loại, mà ở cách chúng bị sử dụng một cách thiếu suy xét để đóng khung, hoặc để kết thúc một thảo luận về điện ảnh thay vì chất vấn và phê bình. Vấn đề này không phải là một niềm tin có ý thức tự thân, mà là một thực hành tự tái sản xuất và tự nhiên hóa những giới hạn của chính nó. Tự nhiên đến mức không ai còn thấy cần đặt câu hỏi về nó nữa.
4. CUỐI CÙNG, VỀ "SHOW DON'T TELL", NGHỆ THUẬT, HÌNH ẢNH, VÀ NGÔN NGỮ,
Đây mới là phần mà bọn mình muốn tập trung. Mấy phần trên chỉ là râu ria. Lịch sử nghệ thuật nói chung, hay cụ thể hơn, là những khoảnh khắc định nghĩa lại lịch sử nghệ thuật nói chung luôn gắn liền với sự giải phóng, với sự thách thức các chuẩn tắc hay tập quán truyền thống, và rộng hơn là với sự làm khác đi. Mấy ai nghĩ hội họa giá vẽ có thể từ bỏ việc tái trình hiện thế giới thực trước khi nhiếp ảnh xuất hiện? Mấy ai nghĩ sân khấu có thể tách khỏi truyền thống kịch học từ thời Aristotle, khỏi sự hiện thực hóa văn bản kịch (nơi tất cả các yếu tố khác đều là thứ cấp so với văn bản kịch), và có thể trở thành không gian trình hiện thuần túy (thay vì tái sản xuất hiện thực-văn bản), phi kịch tính? Thế nên, bất kỳ một thảo luận nào về ngôn ngữ nghệ thuật hay hệ thống quy tắc và tập quán cũng sẽ là câu chuyện của cái đã có và cái chưa có. Nó mang trong mình lịch sử, mang trong mình quan hệ quyền lực, mang trong mình những gì đã được nói và những gì đang bị kìm nén.
Với điện ảnh, một môn nghệ thuật mà hình ảnh là thuộc tính, thì vấn đề này lại càng đáng lưu tâm. Một trong những học giả nghệ thuật mà bọn mình khá yêu thích là W. J. T. Mitchell, cho rằng mọi lý thuyết về hình ảnh, mọi nỗ lực định nghĩa hình ảnh là gì, hay nó khác ngôn ngữ như thế nào, đều đã bị định hình bởi những giả định về ý thức hệ. Hình ảnh không bao giờ “tự” nói, nó nói qua một hệ thống đọc đã được định hình bởi ngôn ngữ. Nói một cách khác, quan hệ giữa hình ảnh và ngôn ngữ không bao giờ là quan hệ bình đẳng hay trung tính: dù là khi coi ngôn ngữ là cao cấp hơn, trừu tượng hơn, lý trí hơn; hay coi quyền lực của hình ảnh như một thứ gì đó nguyên thủy, nguy hiểm, cần được kiểm soát bằng ngôn ngữ [5]. Mitchell truy ngược về thời Hy Lạp cổ đại của Plato, cho đến thời hậu Khai sáng và Lãng mạn Đức của Lessing hay Hegel, và chỉ ra các triết gia phương Tây thường đặt ngôn ngữ cao hơn vì nó gắn với lý trí, với trừu tượng hay tư duy logic. Ngược lại, hình ảnh lại bị đặt thấp hơn vì nó gắn với giác quan, với cụ thể, với cảm xúc, và thường với những gì văn hóa phương Tây coi là nguyên thủy hay nguy hiểm. Mitchell định nghĩa hai khái niệm iconophobia và iconophilia: cái trước là nỗi sợ mang tính cấu trúc qua hình ảnh (vốn gắn liền với hệ thống tư tưởng mà hình ảnh là một phần trong đó); cái sau là sự sùng bái hình ảnh, và coi nó như thứ gì đó thuần khiết, tiền lý trí, và có quyền năng ma thuật vượt khỏi ngôn ngữ [6]. Nhìn theo góc độ này, quan niệm về sự ưu việt của "show don't tell" là một triệu chứng kép. Nó vừa là iconophilia được thể chế hóa trong phê bình điện ảnh phổ thông, khi mà mỗi thể chế đều truyền tải một hệ thống giá trị ngầm về cái gì là điện ảnh “đích thực”. "Show don't tell" là một trong những công thức cô đọng nhất, dễ tiếp cận nhất của hệ thống giá trị đó. Nhưng đồng thời, "show don't tell" cũng là một triệu chứng của iconophobia, dù dưới một lớp lang tinh vi hơn, đó là nỗi lo sợ sự mơ hồ, đa nghĩa của hình ảnh. Cụ thể, “show don't tell” ngụ ý rằng hình ảnh tự thân nó phải truyền đạt thông tin tường thuật một cách rõ ràng và hiệu quả, phải dẫn đến một ý nghĩa được kiểm soát mà không cần sự bổ trợ của âm thanh. Điều "show don't tell" thực sự sợ không phải là lời thoại, mà là sự đa nghĩa của hình ảnh khi không được kiểm soát.
Mitchell khẳng định ngôn ngữ học thông thường đã tạo ra một dạng bẫy nhận thức. Khi ta nói về hình ảnh VÀ ngôn ngữ, thì ta đã ngầm giả định rằng hai thứ đó là hai thành tố có thể tách biệt được. Theo Mitchell, không bao giờ có hình ảnh thuần túy hay ngôn ngữ thuần túy. Mọi hình ảnh đều đã được ngôn ngữ thẩm thấu - được đặt tên, được mô tả, được đọc trong một ngữ cảnh ngôn ngữ cụ thể. Mitchell đưa ra khái niệm imagetext như một thực thể lai ghép trong đó các thành tố hình ảnh và văn bản liên tục thương lượng với nhau, nhằm liên tục nhào nặn các tiềm năng về ý nghĩa, dù chúng không bao giờ đạt được sự thống nhất. Áp dụng khái niệm imagetext, có thể nhìn điện ảnh là một địa hạt trong đó câu hỏi về trường quan hệ hình ảnh/ngôn ngữ được đặt ra một cách cực đoan và liên tục, nơi “show” hay “tell” thuần túy không tồn tại. Mỗi khoảnh khắc trong một bộ phim là một khoảnh khắc thương lượng: giữa hình ảnh và thoại, giữa âm thanh và hành động, giữa nhạc phim và cảm xúc được trình hiện, hay giữa sự vắng mặt và hiện diện của ngôn ngữ trong cấu trúc phim. Hãy xem cách mà Michelangelo Antonioni mô tả sự cô độc, lạc lõng, và vulnerability của nhân vật Claudia trước ánh mắt dò xét của những gã đàn ông trong L’Avventura (1960): máy quay đi theo Claudia một cách đầy xâm phạm, cách Claudia thu vai lại, bước đi nhanh nhưng lại không có mục đích rõ ràng, hay phần thoại của những gã đàn ông mà sự có mặt của Claudia chỉ là vật liệu cho cuộc trò chuyện sặc mùi định kiến giới của họ. Trong phân đoạn này, không có khoảnh khắc nào trong cảnh đó là “show” hay “tell” thuần túy. Các thành tố kể trên đều đang thương lượng với nhau, và nghĩa của cảnh nằm trong sự thương lượng, chứ không phải trong bất kỳ một thành tố đơn lẻ nào.
Một ví dụ về imagetext ở quy mô cấu trúc là News From Home (1977) của Chantal Akerman: khi hình ảnh động của đường phố New York và giọng đạo diễn đọc thư của mẹ không minh họa hay giải thích lẫn nhau. Hình ảnh không “show” nội dung những lá thư, còn những lá thư cũng không “tell” ý nghĩa của hình ảnh. Hai thành tố này đang thương lượng với nhau liên tục, và nghĩa nằm trong khoảng cách giữa chúng: khoảng cách địa lý giữa New York và Brussels, khoảng cách thế hệ giữa mẹ và con gái, khoảng cách giữa ngôn ngữ của người ở lại và hình ảnh của người đã rời đi - một không-gian-không-thể-đi-vào. Thế nên, câu hỏi nên được đặt ra không phải là phương thức nào, “show” hay “tell”, đang thống trị theo một nghĩa cố định, mà là quan hệ đó đang dịch chuyển như thế nào từ khoảnh khắc này sang khoảnh khắc kia, và sự dịch chuyển đó tạo ra ý nghĩa gì. "Show don't tell" tuyên bố giải phóng hình ảnh khỏi ngôn ngữ, nhưng thực ra nó đang lo sợ sự đa nghĩa của hình ảnh [7].
Còn lại, bọn mình xin phép không đánh giá về việc như thế nào mới là “show” đúng, hay như thế nào mới là “tell” chuẩn. Bọn mình chỉ thấy rằng, việc coi "show don't tell" hay phản đề của nó là chân lý phổ quát của điện ảnh là một quan niệm không ổn cho lắm. Tương tự là việc nhìn nhận “show” và “tell” như hai thành tố có thể tách biệt được trong điện ảnh, đặc biệt là điện ảnh chủ lưu.
------------------------------------------------------------------
*Ví dụ, mọi quyết định về góc máy, ánh sáng, nhịp dựng và vị trí của người xem trong quan hệ với hình ảnh đều đã mang trong mình những giả định về cái gì là cái đáng nhìn, ai có quyền nhìn và thực tại nên được trình hiện theo logic nào. Đây là điểm ngưỡng của Roemer (về chất lượng). Mitchell, ở phần cuối, đặt ra một câu hỏi khác (về cấu trúc quyền lực).
**Ở đây, bọn mình diễn giải ý của Panofsky không đồng nghĩa với việc bọn mình hoàn toàn đồng ý với quan điểm này của ông. Tuy vậy, đây vẫn là một cách phân biệt hữu dụng, đặc biệt là khi bọn mình không muốn đưa André Bazin vào cuộc thảo luận.
***Ví dụ, khi chúng ta nói "đây là phim, không phải sách" để bác bỏ phê bình về việc phim ít thoại, hay "điện ảnh phải dùng hình ảnh chứ không phải lời nói" như một nguyên tắc hiển nhiên, specificity thesis đang vận hành, nhưng ở dạng đã được tự nhiên hóa đến mức không còn ai nhận ra nó là một giả định có thể tranh luận được. Vấn đề không phải là specificity thesis đúng hay sai. Ngược lại, quan sát rằng các phương tiện nghệ thuật khác nhau có những khả năng và giới hạn khác nhau là một nhận xét có giá trị. Vấn đề là khi luận điểm mô tả đó bị chuyển hóa thành một mệnh lệnh quy phạm: từ "điện ảnh CÓ THỂ làm những điều mà văn học không làm được" sang "điện ảnh PHẢI làm những điều đó và KHÔNG ĐƯỢC làm những điều văn học làm". Đây là bước nhảy logic mà Noël Carroll đã phê phán, và đây cũng chính xác là bước nhảy mà “show don't tell” thực hiện mỗi khi nó được dùng như một tiêu chí phán xét thay vì một công cụ mô tả.
------------------------------------------------------------------
[1] Về cách diễn giải này, các bạn có thể tham khảo khái niệm sự dày đặc cú pháp (syntactic density) trong cuốn Languages of Art (1968) của Nelson Goodman.
[2] Về không gian tường thuật trong điện ảnh Hollywood và mối quan hệ của nó với cơ chế tái sản xuất ý thức hệ qua sự đóng khung và tự nhiên hóa hình ảnh, các bạn có thể tham khảo cuốn Questions of Cinema (1981) của Stephen Heath.
[3] Về một cách diễn giải chi tiết hơn về điện ảnh, xin mời tham khảo cuốn The Social History of Art (1951), chương VIII. The Film Age của Arnold Hauser. Hauser nhìn đặc trưng của điện ảnh là sự hòa trộn không gian và thời gian theo cách chưa từng có trong lịch sử nghệ thuật. Ông gắn điện ảnh với mô thức của thời hiện đại: của sự phân mảnh không gian [của ống kính], của tính đồng thời [của dựng phim song song], mà sự phát triển công nghệ lần đầu tiên làm con người ý thức được. Đây cũng là lý do mà Hauser khẳng định Proust và Joyce được đọc như những tác giả "điện ảnh nhất" trong văn học hiện đại: không phải vì họ bắt chước kỹ thuật dựng phim, mà vì họ và điện ảnh đang cùng phản ứng với một cấu trúc tri giác của thời đại.
[4] Một cách tiếp cận khác cho vấn đề đọc phim qua lăng kính ký hiệu học này là cuốn Film as Film (1972) của V. F. Perkins, khi ông đề xuất khái niệm về sự mạch lạc nội tại. Theo Perkins, một bộ phim hay không cần tuân theo bất kỳ quy tắc hay tập quán về hình thức nào từ bên ngoài; nó chỉ cần mạch lạc với chính nó, với thế giới mà nó đang xây dựng.
[5] Một cách nhìn khác về mối quan hệ giữa hình ảnh/ngôn ngữ có thể được tìm thấy qua cuốn La fable cinématographique (2001) của Jacques Rancière. Đọc lại Aristotle trong Poetics, Rancière tách biệt giữa mythos và opsis: giữa cốt truyện, sự mạch lạc của tường thuật, logic nhân quả (mang tính lý trí) và các hiệu ứng cảm giác, tác động thị giác phi tường thuật (mang tính tiền lý trí) - vốn là đặc trưng từ tính cơ giới, máy móc của điện ảnh. Rancière khẳng định tính máy móc của điện ảnh tạo ra một lực opsis liên tục kháng cự sự kiểm soát của mythos.
[6] Về mối quan hệ giữa hình ảnh/ngôn ngữ nhưng qua sự phân cấp về tính trung thực, các bạn có thể tham khảo tiểu luận Classic Realist Text (1974) của Colin McCabe. McCabe cho rằng điện ảnh Hollywood cổ điển đưa cho người xem ảo giác rằng khi một nhân vật nói điều gì đó không đúng hay tự lừa dối, hình ảnh biết và cho người xem thấy sự thật mà nhân vật không thấy, hoặc cố tình không thấy. Giả định ở đây là hình ảnh sẽ không bao giờ nói dối.
[7] Một tác giả, đồng thời cũng là một nhà làm phim thể nghiệm, Nathaniel Dorsky, đưa ra khái niệm về hình ảnh đa trị trong điện ảnh - một chỉnh thể không thể bị quy giản về một nghĩa duy nhất. Các bạn có thể tham khảo cuốn Devotional Cinema (2003) rất thơ của Dorsky; khi ông minh định về một cơ chế trải nghiệm điện ảnh mà sự chú ý của người xem hoàn toàn tập trung vào khoảnh khắc, vào sự hiện diện hoàn toàn với trạng thái đang có (thời gian hiện tại), chứ không phải hướng vào câu hỏi khoảnh khắc này dẫn đến đâu (thời gian tương lai).
Enjoy reading!